Download pDec – caso de uso: detección de fraude en datos de

Document related concepts
no text concepts found
Transcript
2016
Detección delFraude conDatos deAseguradoras
Detección yclasificación deactividades fraudulentas basándose enalgoritmos
autodidactas deinteligencia artificial
pDecFraudDetectionbyIndalyzAG
1
CAPACIDAD
Nuestra solución de software exitosamente probada hace posible analizar
conjuntos de datos relacionados con problemas específicos, para determinar
conexiones relevantes y así reducir significativamente el número total de
clientes inicialmente bajo sospecha de fraude.
2
pDec Fraud Detection by Indalyz AG
SOLUCIÓN
① Procesa numerosos formatos de archivo y estructuras de atributos
① Permite una configuración flexible del hardware y de estructuras de
red
① Asegura un manejo seguro de datos e información sensible
① Actualizaciones automáticas constantes y clasifica los datos de
forma robusta y fiable
3
pDec Fraud Detection by Indalyz AG
PROCESOS
Inteligencia
Artificialy
Optimización
Softwarede
Decisión
Preparación y
Concreción de
Datos
4
pDec Fraud Detection by Indalyz AG
Detección De Fraude En Datos de Aseguradoras
Incidencias, Objetivos, Problemas Y Soluciones De
Una Detección Automática De Fraude
5
pDec Fraud Detection by Indalyz AG
EJEMPLO DE ESTUDIO
Alquiler de Vehículos
6
pDec Fraud Detection by Indalyz AG
PROCESO DE ALQUILER
v
v
v
v
Identificación y Credenciales
Cualificaciones
Historia
Solvencia
Proceso de
Cualificación
Agencias
de Crédito
Comprobación de
Antecedentes
Agencias
Privadas
PASA o NO PASA
Legal
Aproximadamente 5.000 casos entrañan fraude grave.
Más de 750.000 clientes afectados.
7
pDec Fraud Detection by Indalyz AG
CIFRAS EN EL FRAUDE DE ALQUILER
Al menos un 0.75% de clientes potenciales tienen intenciones de fraude
v Comparativamente es una pequeña cantidad de clientes
v Casi siempre con posible auto-revelación
v Requiere análisis detallados costosos
¿ Se puede identificar a defraudadores potenciales de forma eficaz
basándose únicamente en la información disponible?
pDecFraudDetectionbyIndalyzAG
8
Thereexistsimplequestions…
CUESTIONES DE SÍ/NO
Hay un gran número de cuestiones de sí/no con significado similar:
v ¿Está justificada una solicitud de reembolso en caso de daño o no?
v ¿Es correcto el reclamo de costes de un servicio asegurable?
v ¿Es el absentismo debido a una enfermedad o no?
Fundamental: confianza mutua entre cliente y aseguradora
Problema: Abuso de confianza en actividades ilegales por una minoría
v provoca pérdidas económicas del orden de millones de Euros
v y requiere la implementación de amplios controles de seguridad
9
pDec Fraud Detection by Indalyz AG
OBJETIVO DE LA DETECCIÓN DEL FRAUDE
¿Se puede seleccionar identificar a defraudadores potenciales de forma
eficaz basándose únicamnete en la información disponible?
SÍ
… pero no en la forma de identificación
… sino en la forma de solo concentración
Proceso
Concentración
10
pDec Fraud Detection by Indalyz AG
TÍPICAS INCIDENCIAS
Obstáculos
11
pDec Fraud Detection by Indalyz AG
OBSTÁCULO 1: DATOS REALES
Datos Fundamentales:
v Datos estructurados
v Conjuntos de aprendizaje clasificados
Problemas de integridad de datos reales:
v Incompletos
v Con errores
v Aberraciones
Solución:
v Concreción de datos con conocimiento experto, patrón de
reconocimiento y relaciones de similaridad
v Limpieza en el conjunto de datos de aprendizaje de los datos que
tengan lagunas de integridad y clasificación
12
pDec Fraud Detection by Indalyz AG
OBSTÁCULO 2: BIG DATA
Más imformación ≠ mejora en la calidad de decisión
Problemas durante el procesamiento del big data:
v Reglas de clasificación bajo-restricciones
v Resolución de información relevante en un mar de datos irrelevante
v Superposición rápida de desviaciones estadísticas
Solución:
v Identificación de atributos relevantes relacionados con el problema
de clasificación
v Tasa como criterio de información-entrópica
v Aplicación de métodos dinámicos de inteligencia artificial
v Formalismos de proyectos
13
pDec Fraud Detection by Indalyz AG
OBSTÁCULO 3: INTELIGENCIA ARTIFICIAL
Método algorítmico estándar: Redes Neuronales
v Dominada en gran medida por la elección de arquitectura de red
v Baja robustez y requiere largo periodo de entrenamiento
v Efectos de saturación y adaptación
Solución:
v Combinando diferentes métodos de inteligencia artificial
v Auto-montaje permanente y reestructurando las redes
v Estabilización estadística y compactación de series de parámetros
14
pDec Fraud Detection by Indalyz AG
PROCESO DEL SISTEMA
Cómo Funciona
15
pDec Fraud Detection by Indalyz AG
PROPIEDADES TÉCNICAS
Solución técnica de manejo de datos auto-organizativa
Acoplamiento eficiente de todos los sistemas de bases de datos comunes
Concepto básico: clasificación de aprendizaje central vs descentralizada
Solución software dinámica: mejoras permanentes de la arquitectura y de la
memoria
v Aplicación en la mayoría de los sistemas operativos(Windows, Linux, OSX)
v Limitación sólo por la RAM
v Diseño personalizado de los interfaces descentralizados y de los interfaces
gráficos de usuario
v
v
v
v
Funciones básicas: (Concepto-SEP)
v Separación de la información irrelevante por métodos de proyección
v Extracción de la información máxima de las instancias disponibles
v Interpretación probabilística de la decisión de clasificación
16
pDec Fraud Detection by Indalyz AG
PROCESO DE APRENDIZAJE
Basededatos centraldeentrada
Algoritmo deaprendizaje
Servidor Central
Datos de
atributo
Reglas de
clasificación
Unidad deentrada
localocentralizada
Parámetros
decontrol
Unidades de
clasificación
descentralizadas
Basededatos
centraldereglas
17
pDec Fraud Detection by Indalyz AG
WORKING PROCEDURE
Entradalocaldedatos
Datosde
atributo
Algoritmosde
clasificación
GUI
Internet
Reglasde
clasificación
Entradayalgoritmos
decontrol
Basededatoscentral
externadereglas
18
pDec Fraud Detection by Indalyz AG
CASO DE ESTUDIO: ALQUILER DE VEHÍCULOS
Aplicación De Detección De Fraude
19
pDec Fraud Detection by Indalyz AG
Clientesfiablesbienidentificados
DETECCION DE FRAUDE EN EL NEGOCIO DEL ALQUILER
v Detección de fraude con 52 atributos relevantes
v 5.000 defraudadores por cada 750.000 clientes (una minoría
relativamente pequeña dentro de una mayoría dominante)
v Selección por elección de tamaño de grupo
Curva Operativa
del Receptor (ROC)
Partededefraudadoresbienidentificados
20
pDec Fraud Detection by Indalyz AG
PRINCIPIO DE COMPRESION
Detección acotada mediante la compresión de datos
Compresión
Silo 1
750.000
Clientes
720.000
Clientes
Proceso de
Compresión
5.000
Defraudadores
Compresión
Silo 2
30.000
Clientes
500
Defraudadores
4.500
Defraudadores
21
pDec Fraud Detection by Indalyz AG
CARACTERÍSTICAS ÚNICAS
v Procesamiento de un amplio espectro de datos
v Diseño flexible de hardware y estructuras de red
v Manejo de datos e información sensible
v Pruebas de estándares de comparación exitosas
v Concentración de casos minoritarios, incluso con poca información
22
pDec Fraud Detection by Indalyz AG
SERVICIOS
Detección De Fraude En Datos De Aseguradoras
23
pDec Fraud Detection by Indalyz AG
SERVICIOS
Principales servicios
v Instalación de software y hardware
v Diseño de interfaces y GUI personalizado y específico al problema
v Conexiones a la base de datos
Servicios adicionales
v Soporte técnico y actualizaciones
v Formación del personal
v Análisis de datos y reporte
24
pDec Fraud Detection by Indalyz AG
CONTACTO
Riedstrasse 7
6330 Cham – Switzerland
http://www.indalyz.com
Tel: +41 (41) 743 07 28
Fax: +41 (41) 743 07 29
[email protected]
25
pDec Fraud Detection by Indalyz AG