Internet es la mayor colección de datos jamás creada por la humanidad. Y eso es algo que, obviamente, no ha pasado desapercibido para los gobiernos, las Fuerzas y Cuerpos de Seguridad e incluso el sector privado. Hoy en día, muchos publican su información personal libre y voluntariamente en las redes sociales o en toda la red. ¿Por qué no utilizar este gigantesco y gratuito conjunto de datos y analizarlo con IA?


¿Qué es OSINT?

En los tiempos de la Guerra Fría, recopilar información sobre el enemigo estaba de moda. En aquella época, HUMINT (inteligencia humana, obtenida de una persona), COMINT (inteligencia de comunicaciones, obtenida de las comunicaciones de voz) y SIGINT (inteligencia de señales, obtenida de señales electrónicas que no son COMINT) eran las principales fuentes de inteligencia, aunque existen algunas otras.

Luego llegó Internet. Al principio no cambió mucho, pero una vez que Internet se generalizó y llegaron las redes sociales y el Smartphone, todo el mundo tuvo de repente la oportunidad de publicar cualquier cosa en línea en cuestión de segundos. Con alcance mundial.

Y esto creó toda una nueva categoría de inteligencia: OSINT (Open Source Intelligence). Es decir, inteligencia producida mediante la recopilación de información disponible públicamente. Para ser francos, la OSINT es en realidad mucho más antigua y data de la Segunda Guerra Mundial, cuando se recopilaba información de inteligencia escuchando la radio pública enemiga y más tarde la televisión. Pero con la digitalización de la información e Internet, la OSINT se disparó.

La información no es inteligencia

Antes de seguir adelante, es necesario aclarar una cosa: disponer de información no es inteligencia. Lo que convierte la información en inteligencia es tener un propósito al examinar esa información. O dicho de otro modo: si la información que has recopilado se utiliza para obtener una perspectiva o responder a una pregunta concreta, se convierte en inteligencia. Los métodos habituales para extraer respuestas de la información consisten en analizarla o correlacionarla con otros datos.

¿Cuáles son las principales fuentes de datos OSINT?

En general, como sugiere el término «Open Source», sus fuentes de datos deben ser de acceso público para ser calificadas como OSINT. Esto incluye lo siguiente

  • Medios de comunicación
  • Plataformas de medios sociales
  • Sitios web
  • Bibliotecas
  • La Web Oscura
  • Registros públicos
  • Imágenes, audio o vídeo

Excepto, tal vez, la Dark Web, casi todo el mundo que lea esto sabe cómo encontrar datos en todas las fuentes anteriores, utilizando sólo un navegador web. E incluso la Dark Web no es realmente tan difícil.

La información que puedes recoger de Internet suele estar en uno de estos cuatro formatos: texto, audio, imágenes o vídeo. Obviamente, existen formatos adicionales como presentaciones, PDF y bases de datos, pero normalmente puedes convertir todos ellos en uno de los cuatro principales.

OSINT Platform

¿Quién utiliza OSINT y para qué?

En general, la OSINT está disponible para todo el mundo. Sin embargo, para realizar investigaciones complejas se necesita, obviamente, más poder de búsqueda que el disponible para cualquier ciudadano particular. Por ello, los colectivos que más utilizan OSINT son los siguientes:

  • Fuerzas y Cuerpos de Seguridad. Obviamente uno de los mayores consumidores de inteligencia OSINT son las Fuerzas y Cuerpos de Seguridad. La utilizan para sus investigaciones, averiguar relaciones entre personas o rastrearlas online, etc.
  • Militar. En realidad, los orígenes de OSINT fueron militares. Así que hoy en día lo siguen utilizando para averiguar posibles amenazas, o información sobre individuos de países específicos.
  • Gobierno. El gobierno puede utilizar OSINT para averiguar más sobre alguien, para cualquier propósito (impuestos, legal, etc.) y obviamente lo utiliza en sus servicios de inteligencia.
  • Despachos de abogados y compañías de seguros. En este caso las motivaciones pueden ser variadas, pero tener acceso a OSINT puede ayudar a resolver o establecer muchos casos legales o reclamaciones de seguros.
  • Finanzas. El sector financiero también puede beneficiarse de vigilar a los competidores, mercados específicos o las actividades públicas de personas con capacidad para influir en los mercados.
  • Investigadores. Tanto los periodistas como los Investigadores Privados pueden utilizar OSINT para avanzar en su historia o caso buscando información sobre las partes implicadas.
  • Marketing. Analizar los mercados, las tendencias del mercado o incluso las tendencias en las redes sociales puede dar pistas sobre futuros desarrollos de productos o servicios o sobre cómo orientar una campaña. También es útil para conocer la reputación de una empresa.

De hecho, es posible que incluso usted haya utilizado OSINT para averiguar información sobre un vendedor de un artículo que quería comprar, o comprobando las redes sociales antes de contratar a alguien.

¿Cómo potenciar el OSINT ?

El principal problema de los sistemas OSINT es que son muy buenos recopilando información y encontrando relaciones, pero no pueden utilizar todos los tipos de datos que obtienen. Las bases de datos y los archivos de texto, los documentos PDF y similares son fáciles de leer y analizar. Sin embargo, el audio, las imágenes y el vídeo no lo son. Representan un cierto tipo de datos no estructurados que no pueden analizarse sin verlos u oírlos.

Y ahí es donde entran en juego herramientas como Intelion. Pueden integrarse en el proceso de adquisición y análisis de datos y son capaces de dar sentido a los archivos de audio, imagen y vídeo aplicándoles distintos analizadores. Por ejemplo, para encontrar una cara, un sonido o un patrón de audio concretos. Intelion también es capaz de transcribir voz a texto y traducirlo, o de encontrar objetos en una imagen o un vídeo. Todos los hallazgos se convierten en metadatos (en formato de texto), que luego se envían de vuelta al sistema OSINT que puede aplicar sus técnicas habituales de procesamiento a estos datos, ampliando así la gama de medios que pueden utilizarse como datos procesables, más allá del simple texto, este software esta pensado para ser utilizado por fuerzas del orden e inteligencia. 

Conclusión

La mayoría de los sistemas OSINT no tienen capacidad para procesar directamente ni los archivos de audio ni los de vídeo y, por tanto, no pueden utilizar la información que contienen. Con plataformas de IA como Intelion, los metadatos se extraen de todos estos archivos siguiendo reglas personalizadas que se pueden especificar. Esto proporciona a cualquier sistema OSINT una nueva dimensión y acceso a una de las mayores fuentes de datos de Internet: el vídeo.

Do you have any OSINT project?