Fraud detection — выявление мошенничества с помощью ML и BigData

Одна из актуальных задач (словом, а какие задачи сейчас неактуальные!) в области Больших Данных — выявление фактов мошенничества или подтасовки фактов. Задача может быть связана практически с любой областью бизнеса — от финансовой до здравоохранения. Вот, собственно, и мой практический интерес был вызван вопросами мошенничества в сфере пенсионных выплат (работаем над проектом для ПФР). Набрел на статью, очень близкую — здравоохранение (страховые выплаты): «Анализ клиентских баз данных. Выявление мошенничества (fraud detection) на базе STATISTICA Data Miner»

Отличительной особенностью статьи можно назвать еще тщательность — очень качественная и практически полезная статья. Вот ее краткое содержание:

  • Краткий обзор Data Mining
  • Вербальная постановка задачи
  • Структура данных
  • Основные подходы обнаружения мошенничества
  • Почему именно технология Data Mining, а не отдельные методы классификации и кластеризации?
  • Алгоритмы кластеризации
  • Описательный анализ
  • Кластеризация K-средних
  • EM-алгоритм
  • Автоматизация
  • Выводы
  • Приложение 1. Алгоритм запуска Алгоритма К-средних
  • Приложение 2. Алгоритм запуска EM-алгоритма
fraud detection

fraud detection

Полезное по теме fraud detection в привязке к Machine Learning и BigData:

Добавить комментарий