Inteligencia de código abierto (OSINT)

Trabajar con Inteligencia de Código Abierto (Parte 1): Extraer información de imágenes en línea

Reporteros Sin Fronteras (RSF) presenta esta serie de artículos sobre Inteligencia de Código Abierto (OSINT, por sus siglas en inglés), un conjunto de técnicas para ayudar a recopilar información de recursos disponibles públicamente. El primer artículo explica cómo los periodistas pueden utilizar la OSINT para analizar y extraer datos de imágenes en línea.

Las técnicas de Inteligencia de Código Abierto (Open Source Intelligence u OSINT) se usan para recopilar, analizar y utilizar información disponible públicamente con el fin de respaldar la búsqueda de datos y la investigación, sin tener que depender de datos internos o clasificados. Este artículo se centrará en la extracción de información de imágenes disponibles en Internet utilizando metadatos, datos incrustados en archivos de imágenes digitales que registran su historial.

Los metadatos pueden revelar mucha información sobre una imagen

  • Fecha y hora en que se tomó la imagen originalmente.
  • Fecha y hora en que se editó la imagen por última vez.
  • Ubicación GPS del lugar donde se tomó la imagen.
  • Nombre del propietario de los dispositivos que almacenaron o editaron la imagen.
  • Nombre original del archivo de la imagen.
  • Modelo de la cámara utilizada.
  • Ajustes de la cámara, como la distancia focal, el tipo de objetivo, la información sobre la apertura y el ajuste del flash.

La cantidad de metadatos disponibles varía en función de la imagen

JPG, uno de los formatos de archivo más comunes para la fotografía digital, suele contener una amplia gama de metadatos, mientras que otros formatos como BMP o PNG pueden incluir menos. Algunos programas como Photoshop alteran los metadatos de la imagen original al exportarla, mientras que algunos proveedores de servicios como Facebook eliminan la mayoría de ellos cuando la imagen se sube al sitio web.

Extraer metadatos es sencillo con las herramientas adecuadas

Los metadatos adjuntos a las fotografías digitales se denominan datos EXIF (del inglés Exchangeable Image File Format, Formato de Archivo de Imagen Intercambiable). La forma más sencilla de obtener los datos EXIF es con un lector EXIF en línea, como Exifinfo, donde los periodistas pueden subir directamente una imagen o enlazar su URL.

Los lectores EXIF en línea son una buena herramienta para analizar imágenes disponibles públicamente en Internet, pero es probable que almacenen las imágenes subidas en un servidor de terceros. Una alternativa que pueden utilizar los periodistas para comprobar la información de fotos sensibles es Exiftool, una aplicación de código abierto que puede analizar los metadatos sin conexión en un dispositivo privado.

Los metadatos pueden utilizarse para detectar la IA generativa y la manipulación de fotografías

El análisis de los datos EXIF puede utilizarse para validar la autenticidad de las imágenes: es probable que los metadatos, como los ajustes de la cámara, no estén presentes en las imágenes generadas por IA. Algunos generadores de imágenes de IA, como DALL-E, Midjourney y Generative Fill, incluso incorporan su firma digital en los metadatos. Los detectores de imágenes de IA en línea, como Is It AI, también pueden utilizarse para ayudar a detectar imágenes generadas por Inteligencia Artificial.

Los periodistas pueden comprobar si las fotografías en línea han sido manipuladas mediante técnicas como el análisis de capas de error o el análisis de ruido. Estas estrategias requieren algunos conocimientos técnicos, pero herramientas de código abierto como FotoForensics o Forensically facilitan a los usuarios menos experimentados la detección de signos de alteración y filtros, así como la lectura de metadatos.

Izquierda: Imagen de ejemplo. Derecha: Imagen analizada por Forensically utilizando el filtro de capas de error. Se muestran elementos de iluminación inconsistentes.

Recomendaciones de seguridad para periodistas sobre metadatos de imágenes

Algunas herramientas OSINT en línea, como los lectores EXIF, suelen almacenar las imágenes cargadas en un servidor de terceros que puede no ser necesariamente seguro. Por lo tanto, si los periodistas desean extraer información de fotos sensibles proporcionadas por fuentes o de sus propias carpetas privadas, deben priorizar las aplicaciones de escritorio sin conexión, como Exiftool, que también admite una amplia gama de formatos de archivos y metadatos.

Además, actores malintencionados pueden aplicar técnicas OSINT a las imágenes en línea para causar daño a periodistas o defensores de los derechos humanos, por ejemplo, encontrando su información personal en los datos EXIF con el fin de exponerlos públicamente. Los periodistas pueden proteger a sus fuentes y a sí mismos modificando los metadatos de las imágenes antes de hacerlas públicas. ExifCleaner es una aplicación de escritorio segura que elimina los metadatos de archivos de imagen, vídeo y PDF.

Leer Parte 2: Trabajar con Inteligencia de Código Abierto (Parte 2): Extraer información de vídeos en línea
→ Leer Parte 3: Optimiza tu investigación conectando los puntos