Desde su lanzamiento en 2024, la función de Resúmenes con IA (AI Overviews) en el buscador de Google ha estado bajo constante escrutinio debido a sus problemas de precisión. A pesar de las continuas actualizaciones en sus modelos subyacentes, un análisis reciente confirma que la herramienta sigue sufriendo de graves episodios de «alucinaciones».
Según una evaluación realizada por The New York Times en colaboración con la startup de inteligencia artificial Oumi, la precisión de los Resúmenes con IA de Google se sitúa en torno al 90%. Aunque la cifra pueda parecer elevada, el inmenso volumen de tráfico de Google implica que una de cada diez respuestas es errónea, lo que resulta en la difusión diaria de decenas de millones de datos falsos a los usuarios.
El límite de la precisión y detalles de las pruebas
Para este estudio se utilizó el estándar SimpleQA de OpenAI, que incluye más de 4.000 preguntas con respuestas verificables. Tras la actualización al modelo Gemini 3, los evaluadores constataron que la precisión alcanzó el 91%, una mejora respecto al 85% que registraba en la era de Gemini 2.5.
Sin embargo, los errores siguen siendo frecuentes. Al consultar la fecha de fundación del museo de la casa de Bob Marley, la IA ofreció una fecha incorrecta con total seguridad, a pesar de que la página de Wikipedia que citaba contenía información contradictoria. En otro caso, al citar una página web sobre la inclusión de Yo-Yo Ma en el Salón de la Fama de la Música Clásica, la IA llegó a afirmar que dicho salón «no existe».
Ante estos cuestionamientos, el portavoz de Google, Ned Adriance, señaló que la compañía considera que el propio estándar SimpleQA contiene información errónea. Google insiste en que sus modelos de IA están en constante evolución y que su objetivo es ofrecer a los usuarios una experiencia de búsqueda cada vez más precisa.
Aunque Google intenta mejorar la fiabilidad mediante iteraciones tecnológicas, la incertidumbre en los contenidos generados por la IA sigue siendo difícil de erradicar por completo. Para los usuarios que dependen del buscador para obtener información veraz, este margen de error de «uno de cada diez» sigue representando un riesgo que no debe pasarse por alto.