xiand.ai
9 abr 2026 · Actualizado 03:43 UTC
IA

La Biblioteca Nacional de Datos del Reino Unido se enfrenta a un cuello de botella en la calidad de la información

Un estudio del Open Data Institute (ODI) advierte que la iniciativa del gobierno británico de crear una Biblioteca Nacional de Datos para impulsar la inteligencia artificial corre el riesgo de fracasar debido a la falta de metadatos y al caos en el etiquetado de los conjuntos de datos públicos.

Alex Chen

2 min de lectura

La Biblioteca Nacional de Datos del Reino Unido se enfrenta a un cuello de botella en la calidad de la información
Conceptual image of a national data library for artificial intelligence.

El gobierno británico planea utilizar la Biblioteca Nacional de Datos (NDL, por sus siglas en inglés) para proporcionar un respaldo de datos públicos al desarrollo de la inteligencia artificial; sin embargo, un reciente informe del Open Data Institute (ODI) señala que el proyecto se enfrenta a serios obstáculos para su implementación.

El gobierno confirmó el proyecto de la NDL en el presupuesto de otoño de 2024, comprometiendo una inversión de 100 millones de libras esterlinas. El objetivo es integrar datos del sector público para fomentar la innovación impulsada por IA tanto para investigadores como para empresas. No obstante, al desarrollar un prototipo denominado "NDL-Lite", el ODI descubrió que la calidad actual de los datos públicos dista mucho de cumplir con los requisitos necesarios para aplicaciones de IA.

Disponibilidad de datos y el riesgo de que la IA busque "caminos alternativos"

Los investigadores del ODI procesaron 38 GB de datos provenientes de seis organismos públicos, integrando más de 100.000 archivos. El experimento reveló que muchos conjuntos de datos en plataformas como data.gov.uk presentan etiquetas erróneas, información obsoleta o carecen de metadatos. Por ejemplo, algunos archivos etiquetados bajo la categoría de "delincuencia" resultaron ser informes estadísticos locales incompatibles entre sí, lo que impide que los sistemas de IA realicen análisis comparativos eficaces entre regiones.

Un problema aún más grave es la falta de actualización de conjuntos de datos fundamentales. El ODI destacó que una base de datos clave del Ministerio del Interior sobre criminalidad no se ha actualizado desde 2018 y no es accesible a través de la API de la Oficina de Estadísticas Nacionales (ONS). Cuando los agentes de IA no pueden obtener datos fiables de fuentes oficiales, suelen recurrir a noticias o fuentes comerciales, cuya precisión es, a menudo, cuestionable.

La profesora Elena Simperl, directora de investigación del ODI, afirmó que el estudio pone de relieve la brecha existente entre el volumen de datos públicos y su utilidad real. En una entrevista, advirtió: "Si los datos oficiales no ofrecen el respaldo necesario, los agentes de IA simplemente ignorarán los canales gubernamentales y buscarán información en fuentes alternativas".

El Departamento de Ciencia, Innovación y Tecnología (DSIT) del Reino Unido había anunciado previamente la finalización de una fase de descubrimiento a gran escala para preparar el terreno hacia una reforma sistémica del sector público. Sin embargo, las conclusiones del ODI sugieren que la inversión gubernamental por sí sola no basta para sostener la industria de la IA; la limpieza y estandarización de los datos existentes son ahora la prioridad absoluta.

Los resultados actuales indican que, si el gobierno no logra mejorar significativamente la precisión y la estructura de la información, el proyecto de la NDL corre el riesgo de convertirse en un "cementerio de datos" que los sistemas de IA no podrán aprovechar.

Etiquetas

Comentarios

Los comentarios se almacenan localmente en tu navegador.