Así sabe la policía si tu denuncia es falsa (y acierta un 91% de veces)

49 meneos

2748 clics

Este envío tiene varios votos negativos. Asegúrate antes de menear

Así sabe la policía si tu denuncia es falsa (y acierta un 91% de veces)

El inspector Miguel Camacho, licenciado en Matemáticas y Estadística, leía en 2012 en una comisaría del centro de Granada las declaraciones de robos con violencia en la calle. Era su primer destino como policía después de la academia. Algunas denuncias le parecían falsas, sobre todo las vinculadas a teléfonos móviles caros. "Pero yo entonces era muy ingenuo", dice. Camacho no concebía que alguien acudiera a la policía a denunciar algo que no había ocurrido para cobrar, por ejemplo, un seguro.

34 15 31 K 37

37 comentarios

34 15 31 K 37

Comentarios destacados:

#1 lithium777

Artículo completo (AEDE): elpais.com/tecnologia/2018/09/16/actualidad/1537135174_883514.html

1 25
#2 thoro

Se centra en las palabras más usadas.
Obviamente la primera es iPhone.
Si la repites 3 veces eres culpable.

0 9
#3 Bottle

#0 www.meneame.net/story/inteligencia-artificial-detectar-denuncias-falsa

Creo que es lo mismo.

8 120
#4 maria1988

#1 De hecho, el envío es copia/plagio de tu enlace.

5 63
#5 --54026-- *

» ver comentario
#6 --583514--

#5 Es de Tecnología, y cada vez esto está más de capa caída.

1 25
#7 --54026--

» ver comentario
#8 parabola

Da igual. #Yosítecreo

0 8
#9 avalancha971

#4 Para evitar enlazar a AEDE, copia pegada en un foro... Pues no sé qué es peor.

3 43
#10 Magankie

#5 Será que no hay nada con más karma entre las nuevas...

Me ha parecido interesante. El caso es que estamos hablando de un texto, en el cual no se plasma el estado de la víctima ni cualquier otro dato. ¿Tal vez es algo irrelevante?

0 9
#11 ElPerroDeLosCinco

No me queda claro dónde interviene la inteligencia artificial en este proyecto. Si se trata de identificar y contar palabras clave, eso no es IA. Ahora bien, si el sistema va aprendiendo de sus errores y aciertos, y es capaz de identificar por su cuenta nuevos patrones y después aplicar y hacer un seguimiento de estas hipótesis, sí que estaríamos hablando de IA.

2 18
#12 --587543--

» ver comentario
#13 keiko_san

Gracias.
Ya se como me tengo que inventar mi proxima denuncia falsa para que sea mas creible.

2 24
#14 Misth

#5 Es importante saber como colar una denuncia falsa como verdadera para algunos admins.... ya sabes, cuestiones de ideologias y estadisticas

Sorprendete de que no la incluyan como asignatura de esas que querian imponer con la coletilla (de genero)....es material de primera para algunas futuras denunciantes.

1 16
#15 aauivozcrx

y los montajes policiales también los sabe detectar o eso ya tal?

1 13
#16 --76102--

Para evitar el AEDE nos envían a ForoPolicía. En la buena dirección.

0 9
#17 --23321--

#12 si

0 10
#18 ElPerroDeLosCinco

#12 Es una parte de la IA. Como pueden serlo también el reconocimiento de imágenes, o la lógica difusa... No hay una definición estricta de lo que es "inteligencia artificial", porque ni siquiera la hay sobre lo que es "inteligencia". Por ejemplo, hay quien dice que los robots androides forman parte de la IA, cosa que yo no considero rigurosa.

1 28
#19 Thony

#11 Exacto. Ya en una parte del artículo hace mención al "algoritmo" que usa. Pero hoy en día, la palabra "IA" vende muchísimo, y a cualquier aplicación o programa que desarrolles, si le incluyes ese término, tiene más capacidad de marketing.

Por otro lado, dice que un policía experto detecta un 75%, el programa un 91%. Es un avance, pero todo y así, el margen de un 9% de error es muy alto para que los policías (o los seguros) se amparen en el uso de este programa para descartar automáticamente denuncias. Espero que no sea así.

1 26
#20 rafran

#13 Correcto, ya tienes el material para preparar la declaración

0 6
#21 --587543--

» ver comentario
#22 chu *

#9 Peor es enlazar a aede directamente, si en ese foro son unos radicales que se saltan las normas o deseos de elpaís allá ellos.
El artículo es el mismo y está referenciado, yo prefiero leerlo en el foro.

0 7
#23 Gilbebo *

#19 Lo importante es discriminar qué % de las falsas declara como verdaderas (y el seguro acabaría teóricamente pagando por cometer un error estadístico de tipo 1) y qué % de las verdaderas declara como falsas (y encima de que te han robado va y la policía te denuncia, en el peor de los casos, por falsedad a un juez.e intento de estafa a una aseguradora: error 2). En estos casos creo que es mejor solo declarar como falsa aquella sobre la que no haya casi ningún género de duda y llevarlas al juez (nivel de confianza 99%) aunque se nos cuelen unas cuantas muy dudosas que ya pillaremos en la siguiente ocasión.

2 33
#24 Hysbald

Me sorprende la cantidad de denuncias falsas que se presentan por robos. Aún así, no veo a nadie pidiendo que cambien la ley...

0 9
#25 --491272--

#22 supongo que sabe usted que aquí quienes se saltan las normas de mnm son los boicoteros

1 28
#26 fluffy

#11 No conozco VeriPol, pero sí sé cómo lo implementaría yo, y sí implica IA.
El problema es un clasificador binario de libro, como los que deciden si un mensaje es spam o no. Para hacer clasificadores en lenguaje natural hay muchas aproximaciones, una de ellas es que la IA se lee montones de textos (corpus) para calcular vectores que representan a las palabras, de esa manera puedes hacer operaciones con las palabras como Rey - hombre + mujer = reina. Pero esto no me aportaría mucho para clasificar así que mi aproximación serían los siguientes pasos:
- Tokenizar: dada un texto saber partirlo en frases y cada frase en palabras. No es tan trivial como parece porque en muchos idiomas hay contracciones y similares y tokenizar significa romperlas en palabras, por ejemplo "don't" debe tokenizarse a ["do", "not"]
- Eliminación de palabras que no aportan significado (stopwords). El problema de tener muchas palabras es que la eficiencia y el tiempo de entreno crecen mucho con la cantidad de palabraa diferentes.
- Cálculo de la raíz o lema de cada palabra. Se puede elegir la primera (stemming) y nos devolverá la raíz, por ejemplo de "viajando" nos dará "viaj", o la segunda (lemmatizing) para obtener el lema, "viajando" nos debería dar "viaje". Los stemmers son más sencillos, y puedes encontrar Porter stemmers para los lenguajes más comunes.
- El siguiente paso es tener denuncias, muchas, y clasificadas a si eran falsas o no. Para cada una haremos los pasos anteriores obteniendo un vectoe de palabras, y obtendremos una lista completa de todas las raíces diferentes usadas entre todos los textos y la cantidad de veces que aparecen en global y por texto.
- Parte de los documentos (un 70% por poner un ejemplo de cifra) se usará para entrenar y el otro 30% para comprobar el entrenamiento. Esto se hace pars comprobar no solamente que nuestra IA aprende sino para evitar algo llamado "overfitting" y que consiste en que la IA no generalice el patrón sino que se ajusta exactamente a los datos de entrenamiento, no funcionando correctamente fuera de esos datos.
- Y aquí ya es escoger algoritmo. Al ser solamente dos clases (es falsa o no) hay muchísimas opciones, Naive Bayes, logistic regression, CNN, RNN, two-class boosted decission tree,... Pero el texto nos da una pista de que no es solamente por palabras sueltas sino que identifica combinaciones de palabras así que apostaría por LSTM RNN. Una vez entrenado obtienes un modelo, que no es más que un montón de numeritos, y obtenerlos es lo que lleva tiempo (entrenar) y GPU.
- Ya tienes tu entreno, te llega una frase, haces los pasos de tokenizar, quitar stopwords y stemming, calculas un vector de features, lo pasas por tu modelo y te devuelve un valor y la probabilidad de qie sea ese valor.
- Queda evaluarlo. Lo binario es bonito, así que puedes evaluar verdaderos positivos, falsos positivos, verdaderos negativos, falsos negativos y calcular medidas de lo bien que funciona. La gente se suele fijar en el accuracy, lo bien que acierta los positivos, pero eso da el problema de idenficar una denuncia como falsa y que sea verdadera, y para medir eso está el recall. Teniendo en cuenta accuracy y recall se calcula una tercera llamada f1-score que suele ser la que se usa para decir si tu modelo es bueno o no. También se usa bastante el AUC (Area under the curve), que básicamente es un número de 0 a 1 dónde 0.5 es lo que te daría el azar.

3 22
#27 --407839--

Creo que con la moda de la IA, estamos empezando a llamar IA a software "normal"

0 6
#28 --490971--

#25 Citation required
Datos, please.

0 8
#29 squanchy *

#12 Grosso modo (no me crucifiquéis, que esto es un simple comentario para dar algo de cultura general), hay tres clases programas que se consideran IA:

- algoritmos de búsqueda de estados con heurístico (minimax, poda alfa-beta, A*,...). Se usan p.e. en el ajedrez. A un estado fijo (una foto del problema) asigna un valor mediante una función (heurístico), y se busca el estado que tiene mayor o menor valor de todos los posibles.

- redes neuronales. Es un instrumento matemático donde hay un grafo con pesos (valores) en los nodos (las neuronas). Nuevos valores de entrada se corresponden con una nueva salida, y eso altera los pesos de los nodos. Entrenas a la IA. Ahí entra el machine learning. Al final la red neuronal tiene una configuración determinada por su entrenamiento, pero que ningún humano sabe interpretar específicamente.

- algoritmos basados en pesos y reglas. Se define un objetivo, se parte de un estado inicial, y se van aplicando un conjunto de reglas que se van aproximando a la solución, hasta dar con ella. Lo usan los sistemas expertos. Por ejemplo, das los datos de un pájaro que has visto (color, tamaño, entorno,...) y el sistema es capaz de decirte qué especie es. Para cada dato que aportas, premia unas especies y penaliza otras, hasta dejarte una como más probable.

1 26
#30 --587543--

» ver comentario
#31 squanchy

#30 Quédate con que hay más algoritmos de IA además de las redes neuronales y su machine learning.

1 26
#32 --587543--

» ver comentario
#33 squanchy

#26 Mira, te voy a votar positivo sólo por la pechá de escribir que te has dado.

1 14
#34 fluffy

#33 Pues... fue desde el móvil, iba en el metro camino al trabajo. No tengo una tendinitis de milagro

0 6
#35 squanchy

#32 Te dejo un enlace sencillito por si quieres echarle un ojo este fin de semana, para que aprendas cómo funciona una IA de búsqueda en estados. Los juegos de ajedrez funcionan así (más o menos). Básicamente, genera todos los movimientos posibles tuyos, y de tu contrincante, les asigna un valor, y sigue el camino que le asegura el éxito. devcode.la/tutoriales/algoritmo-minimax/

1 26
#36 --587543--

» ver comentario
#37 --491272--

#28 las opciones de voto negativo son las que son y no hay ninguna que sea aede.
De ello se infiere que cuando se vota negativo un envío por el solo hecho de ser aede se esta haciendo un uso fraudulento del voto negativo, ya que el envío no sera copia, irrelevante o spam.

0 10