Аннотации:
Обʼєкт дослідження: методи та моделі машинного навчання.
Предмет дослідження: методи виявлення аномалій та моделі класифікації,
призначені для виявлення викидів у транзакційних наборах даних.
Мета дослідження: розробка та оцінка ефективності моделей машинного
навчання для автоматичного виявлення викидів у великих наборах даних,
зокрема в контексті транзакційної активності користувачів.
Використані моделі: у програмній реалізації було використано
логістичну регресію, дерева рішень, випадковий ліс, XGBoost та SVM — для
порівняння їх здатності виявляти нетипові (аномальні) спостереження в даних.
Актуальність роботи зумовлена стрімким зростанням обсягів цифрових
даних, у яких виявлення викидів є критично важливим як для підвищення
якості аналітики, так і для своєчасного реагування на потенційно небезпечні
або помилкові транзакції. Викиди можуть свідчити про збої, шахрайство або
нестандартну поведінку системи.
Отримані результати: реалізовано та протестовано декілька моделей
машинного навчання, які продемонстрували здатність виявляти викиди у
транзакційних даних з високою ефективністю. Було проведено аналіз якості
моделей за стандартними метриками.
Подальші напрямки дослідження включають використання глибокого
навчання, методів напівасупервізованого навчання, а також розширення
вхідних ознак для підвищення точності виявлення аномалій.