Machine learning contra el blanqueo de capitales


¿Puede ser Machine learning un arma contra los delitos financieros? ¿Podrían servirnos las nuevas tecnologías para luchar contra la financiación de organizaciones terroristas? Como parte de las actividades de investigación, GFT dispone de un centro de competencia de Data donde precisamente ha desarrollado una Prueba de Concepto (PoC) sobre la lucha contra el blanqueo de capitales. El objetivo: proporcionar una aplicación que proporcione un análisis mucho más profundo de la actividad del cliente y que permita a la entidad mitigar los riesgos y ayudarla en la toma de decisiones.

En general, los departamentos de gestión de patrimonios privados (Private Wealth Management) protegen a los particulares con un alto patrimonio neto, ofreciendo asesoramiento de inversión, servicios bancarios y de gestión de patrimonios, tales como la planificación de la sucesión, etc. Normalmente, estos clientes tienen más de un millón de euros disponibles para invertir. Las presiones reguladoras internacionales están aumentando para que los bancos realicen revisiones periódicas de estos clientes con el objetivo de detectar posibles casos de actividades ilegales, específicamente blanqueo de capitales y financiación de organizaciones terroristas.

Cuando una entidad incorpora un cliente nuevo debe procederse a una revisión inicial y, a partir de ese momento, dependiendo de la sensibilidad del mismo, se deben realizar revisiones anuales o, incluso, semestrales. Éstas llevan bastante tiempo y, por lo general, incluyen la recogida de determinados documentos (declaraciones de impuestos, etc.), las búsquedas en repositorios de información externa (listas de personas conocidas involucradas en actividades ilegales) o en formato libre realizadas en Internet (utilizando Google y otros buscadores) para localizar el nombre del cliente junto con ciertos términos clave como “lavado de dinero”, etc.

Estas investigaciones se realizan de forma manual y, normalmente, siguen un procedimiento que no es ni estándar ni auditable. Por lo tanto, el objetivo de la Prueba de Concepto (PoC) de GFT es proporcionar una aplicación para apoyar la toma de decisiones en los programas de lucha contra el blanqueo de dinero. Así, esta PoC fue diseñada para satisfacer los siguientes requisitos proporcionados por un determinado cliente:

  • Asistencia en el descubrimiento de perfiles de redes sociales
  • Descubrimiento y clasificación automáticos de los contactos relevantes
  • Identificación automatizada de entidades relacionadas en redes sociales: personas, lugares y organizaciones
  • Recopilación de “información relevante adversa” automatizada de Google con interés en el descubrimiento de blanqueo de capitales automático
  • Predicción y registro de individuos sospechosos de AML (preliminar)
  • Persistencia en procesos due diligence para propósitos de auditoría

El resultado de la PoC ha sido una aplicación web para el soporte de la toma de decisiones mediante el procesamiento automático de datos no estructurados, obtenidos de búsquedas tanto en la web como en redes sociales.

¿Qué técnicas de machine learning se han usado?

Así, para apoyar la toma de decisiones, esta aplicación usa algunas de las técnicas de machine learning como:

  • Agrupamiento K-Means. Esta técnica de aprendizaje no supervisado sirve para agrupar entidades según su similitud. Al ser no supervisado, no requiere entrenamiento previo ni, por lo tanto, la existencia de un conjunto de datos previamente clasificado. El número de contactos en cualquier red social de un individuo puede ser muy elevando. Esta técnica permite la clasificación y priorización automática de los contactos del individuo siendo analizado.
  • Técnicas de procesamiento de lenguaje natural (NLP) y Extracción de Entidades (Named-Entity Recognition) .Normalmente, los resultados de las búsquedas en la web se presentan al usuario sin ningún tipo de procesamiento. Las técnicas de extracción de entidades permiten identificar y extraer entidades nombradas de un texto cualquiera, así como su clasificación automática en una de las siguientes categorías: nombres de personas, organizaciones, localizaciones, expresiones de tiempos, cantidades, valores monetarios, etc. Así, esta técnica permite extraer información de manera automática sin que el usuario tenga que personalmente procesar los resultados de las búsquedas, obteniendo muy rápidamente un contexto concreto del individuo bajo investigación. En este caso, se usa una implementación de la librería de procesamiento de lenguaje natural de Stanford.
  • Técnicas de agrupación y resumen automático sobre texto libre.Como en el caso anterior, tener que procesar todos los resultados de las búsquedas conlleva mucho tiempo. Poder agrupar aquellos resultados con el mismo o muy similar contenido, reduce el tiempo y, por lo tanto, el coste de la investigación. Así mismo, poder obtener de manera completamente automática un resumen de los documentos a procesar por el analista investigador reducirá el tiempo requerido para realizar la investigación.
  • Reconocimiento de imágenes.Las técnicas de aprendizaje automático en el campo de la visión de computadoras consiguen extraer automáticamente información de las imágenes. Así, estas técnicas permiten incorporar documentos gráficos al proceso de investigación sin la necesidad de que un humano interprete todas y cada una de esas imágenes. Para la elaboración de la PoC se hizo uso de la API de Visión de Google.

En definitiva, la incorporación de información obtenida en internet y en las redes sociales es parte natural del proceso de investigación pero incorpora un volumen de datos difícil de procesar. El uso de técnicas de Machine Learing facilita muchísimo el examen de esta multitud de fuentes de datos digitales, incluyendo motores de búsqueda como Google y todo tipo de redes sociales, para detectar si algún cliente pudiera estar involucrado en delitos financieros. Los beneficios son la afinación y focalización en los resultados de la investigación mediante el soporte a la toma de decisiones y la reducción de tiempos y, por lo tanto, de costes de estos procesos de investigación.

Si estás interesado en una demo o en obtener más información, no dudes en contactar con nosotros.