Hackathon Unidad de Búsqueda virtual Bogotá
Este evento es sólo para los campistas de Bogotá de TalentoTECH del MinTIC.
Modalidad virtual
Vamos a tener disponible una sala de Google Meet para que sigas cada momento:
Sala de Google Meet
Material para proyectos
Archivos para la Hackathon Unidad.
¿Cómo calificar proyectos por parte de los jurados?
Validación de ideas de negocio digitales.
Cómo participar en una Hackathon.
Cómo conformar un equipo de trabajo en una hackathon.
Reportar avances en el proyecto.
Cómo usar la plantilla de Pitch Final para Hackathon.
Desafío de la hackathon
La Unidad de Búsqueda de Personas dadas por Desaparecidas (UBPD) es una entidad del Estado colombiano de carácter humanitario y extrajudicial que, dentro del Sistema Integral para la Paz, dirige, coordina y contribuye a la búsqueda de personas dadas por desaparecidas en razón y en contexto del conflicto armado.
La Unidad de Búsqueda enfrenta un desafío crítico en el manejo de grandes volúmenes de información textual relacionada con la desaparición forzada y otros crímenes derivados del conflicto armado en Colombia. Esta información es clave para la búsqueda de personas desaparecidas, la identificación de patrones y la generación de datos que puedan acelerar los procesos de justicia y reparación. Sin embargo, gran parte de los datos disponibles provienen de relatos escritos por víctimas, testigos y otras fuentes, lo que dificulta su sistematización y uso eficiente. La falta de una herramienta que permita extraer, categorizar y analizar automáticamente esta información representa un obstáculo importante para la misión de la unidad. Además, existe la necesidad de integrar y consolidar datos de diversas fuentes, como relatos, tablas y referencias geográficas, para construir herramientas avanzadas que permitan consultas complejas y detalladas.
El reto de innovación se enfoca en aprovechar técnicas de procesamiento de lenguaje natural (NLP), inteligencia artificial y modelos de aprendizaje profundo para extraer información clave de los relatos, generar clasificaciones y, en su nivel más avanzado, implementar modelos LLM multimodales para ofrecer una herramienta de consulta por prompt, que permita a los usuarios acceder a información precisa sobre personas desaparecidas y hechos asociados al conflicto.
Niveles de desarrollo:
Básico: 1. Aplicación de técnicas de procesamiento de texto para extracción automática de atributos de interés: nombres, entidades (grupos armados, empresas), fechas, lugares, actividades, etc.
- Objetivo: Desarrollar un modelo que permita extraer de aquellas variables tipo texto que se encuentran en el Universo, información asociada a nombres, lugares, fechas, actores armados y demás información que permita complementar la información y aportar para la búsqueda de personas desaparecidas.
- Requisitos:
- Definir el Set de datos para la implementación.
- Realizar un proceso de anonimización.
- Definir las variables de interés que se deben buscar y extraer.
- Implementar algoritmos de inteligencia artificial y machine learning tales como NPL que permita realizar una extracción de datos.
Intermedio: 2. Analítica y generación de categorías a partir de información del relato.
Objetivo: Desarrollar un modelo de clasificación binaria o múltiple que permita a través del relato identificar aquellos casos que hacen referencia al conflicto armado que por ende serían competencia de la UBPD determinar su suerte y paradero.
- Requisitos:
- Definir el Set de datos para la implementación.
- Realizar un proceso de anonimización.
- Realizar un proceso de etiquetado para los datos de entrenamiento.
- Implementar modelos de clasificación binaria que permita categorizar los registros y determinar la competencia de la UBPD.
Avanzado: 3. Aplicación de modelos LLM multimodales (tipo ChatGPT, Gemini, Llama, etc) basado en relatos, tablas, geografía, etc. para la construcción de una herramienta de consulta por prompt.
- Objetivo: Desarrollar una herramienta avanzada de modelos LLM basado en la información del Universo, Sitios de Interés y demás fuentes, que permitan brindar información acerca de una persona, hecho o situación asociada a un hecho de desaparición.
- Requisitos:
- Definir los Set de datos para la implementación.
- Integrar datos de diversas fuentes, asegurar su calidad y coherencia.
- Implementar modelos LLM multimodales.