Motores de búsqueda impulsados por IA favorecen fuentes menos populares, encuentra estudio

Puntos clave
- Investigadores compararon enlaces tradicionales de Google con AI Overviews, Gemini‑2.5‑Flash y GPT‑4o.
- Las consultas de prueba provinieron de WildChat, AllSides y búsquedas de productos de Amazon.
- Las herramientas de búsqueda de IA frecuentemente citan sitios web fuera de los primeros 1,000 dominios de Tranco.
- El 53 por ciento de las fuentes de AI Overview no estuvieron en los primeros 10 enlaces de Google para la misma consulta.
- El 40 por ciento de esas fuentes estuvieron ausentes de los primeros 100 enlaces de Google.
- Los hallazgos resaltan un cambio hacia fuentes menos populares en los resultados de búsqueda impulsados por IA.
- Las implicaciones incluyen una exposición más amplia de contenido pero también preocupaciones sobre la autoridad de las fuentes.
Investigadores de la Universidad Ruhr y el Instituto Max Planck examinaron cómo las herramientas de búsqueda de IA generativa difieren de los resultados tradicionales de Google. Su análisis de Google AI Overviews, Gemini‑2.5‑Flash y GPT‑4o mostró que estos sistemas citan regularmente sitios web que se encuentran fuera de los primeros 10 o incluso de los primeros 100 enlaces de Google para las mismas consultas.
Antecedentes y motivación
Desde el lanzamiento de Google’s AI Overviews, ha crecido la conciencia pública sobre las formas en que los resultados de búsqueda de IA generativa pueden divergir de la lista convencional de enlaces producida por los motores de búsqueda tradicionales. Para quantificar esta divergencia, investigadores de la Universidad Ruhr en Bochum y el Instituto Max Planck para Sistemas de Software realizaron un estudio sistemático.
Metodología
El equipo comparó los resultados de enlaces tradicionales de Google con las salidas generadas por IA de tres sistemas: Google’s AI Overviews, Gemini‑2.5‑Flash y OpenAI’s GPT‑4o (tanto en su modo de búsqueda web como en la variante que invoca una herramienta de búsqueda separada). Las consultas de prueba se extrajeron de varias fuentes, incluyendo preguntas específicas presentadas a ChatGPT en el conjunto de datos WildChat, temas políticos enumerados en AllSides y los productos de Amazon más buscados.
Métricas de popularidad
Para evaluar la popularidad de las fuentes, los investigadores utilizaron el sistema de clasificación de dominios Tranco, que clasifica los sitios web según el tráfico y otros factores. Examinaron si los dominios citados caían dentro de los primeros 1,000, 1,000,000 o más allá de estos umbrales.
Hallazgos clave
El análisis reveló un patrón consistente: las herramientas de búsqueda impulsadas por IA tendían a citar sitios web menos populares en comparación con los resultados tradicionales de Google. Por ejemplo, la fuente mediana referenciada por Gemini cayó fuera de los primeros 1,000 de Tranco en todas las consultas. En general, la mayoría de las fuentes referenciadas por las AI Overviews no aparecieron en los primeros 10 resultados de enlaces de Google para la misma consulta, y muchas estuvieron ausentes de la lista de los primeros 100.
En particular, el 53 por ciento de las fuentes citadas por Google’s AI Overviews no estuvieron presentes en los primeros 10 enlaces de Google, y el 40 por ciento no aparecieron incluso en los primeros 100 enlaces de Google. Se observaron tendencias similares para Gemini y GPT‑4o, lo que indica que los motores de búsqueda generativos frecuentemente extraen de dominios que no aparecerían en una búsqueda orgánica estándar.
Implicaciones
Estos hallazgos sugieren que la búsqueda impulsada por IA redefine el panorama de la información al exponer a los usuarios a contenido de sitios menos visitados. Si bien esto podría ampliar las perspectivas, también plantea preguntas sobre la confiabilidad y autoridad de las fuentes presentadas. La investigación subraya la necesidad de un escrutinio adicional sobre cómo los modelos generativos seleccionan y clasifican la información, especialmente a medida que la búsqueda basada en IA se vuelve más prevalente.
Conclusión
El estudio proporciona evidencia empírica de que los motores de búsqueda impulsados por IA se desvían de la búsqueda tradicional en la popularidad de las fuentes citadas. A medida que la IA generativa continúa integrándose en las experiencias de búsqueda, entender estas diferencias será crucial para los usuarios, desarrolladores y formuladores de políticas por igual.