Выявление субъектов торговли людьми

Решение задачи полуавтоматической идентификации субъектов, вовлеченных в торговлю людьми.

Data mining
Formal concept analysis
Knowledge discovery

2013

Коротко о главном

Задача

Разработать ПО для полиции Амстердама для помощи в идентификации субъектов, вовлеченных в торговлю людьми.

Решение

  • Использование современного метода анализа данных FCA
  • Участие в создании ПО по обработке неструктурированных массивов данных

Торговля людьми

Одним из самых интересных исследований, в котором мы принимали участие, был совместный проект полиции города Амстердам и московского национального исследовательского университета "Высшая Школа Экономики".

В рамках данного проекта была задача полуавтоматической идентификации субъектов, вовлеченных в торговлю людьми (human traffic). Эта сфера криминальной деятельности является одной из самых быстрорастущих. Согласно исследованиям, до 2 000 000 женщин ежегодно вовлекается в этот вид нелегального бизнеса.

От офицеров голландской полиции требуется ежедневное составление отчетов о любых, даже самых малозаметных событий и наблюдений. На основе этой информации накапливается база из сотен тысяч отчетов, из которой, потенциально, можно извлечь множество полезной информации: не очевидные контакты между подозреваемыми, социальный граф взаимодействий, временные отношения и так далее.

Рис 1. Число зарегистрированных случаев торговли людьми по регионам

Решение

Большой проблемой является тот факт, что накопленная информация сохранена в неструктурированным виде, что препятствует анализу данных. В результате этого, одной из центральных задач является выделение информации из массива данных, т.е. задача data mining'a.

Рис 2. Решетка формальных понятий (FCA)

Для решения задачи выделения семантики, был использован индексатор Lucene в связке с построенным тезаурусум, включающий в себя как отдельные термины, встречающиеся в отчетах, так как и смысловые кластеры.

Визуализация и исследование данных проводится при помощи решетки анализа формальных понятий, одним из самых последних методов анализа данных.

В результате программа была успешно внедрена в работу полиции города Амстердам. Благодаря взаимодействию специалистов по анализу данных с данным продуктом были успешно выявлены преступления в сфере торговли людьми и оказана неоценимая помощь в деле борьбы с людским трафиком.