Google lanza servidor MCP de Data Commons para llevar datos del mundo real a la IA

Puntos clave
- Google lanza servidor MCP de Data Commons para proporcionar acceso de lenguaje natural a conjuntos de datos públicos.
- El servidor MCP se basa en Data Commons, que agrega datos de encuestas gubernamentales, administraciones locales y organismos internacionales.
- El protocolo de contexto de modelo, introducido originalmente por Anthropic, permite que los modelos de IA soliciten datos contextuales sin conocimientos detallados de API.
- Herramientas como el kit de desarrollo de agentes (ADK), la interfaz de línea de comandos de Gemini y un paquete PyPI facilitan la integración para los desarrolladores.
- La asociación con la campaña ONE produce el agente de datos ONE, que superficia millones de puntos de datos financieros y de salud en lenguaje plano.
- El servicio tiene como objetivo reducir las alucinaciones de IA al fundamentar las salidas del modelo en datos verificables y de alta calidad.
- La adopción de la industria abierta por empresas como OpenAI y Microsoft señala una aceptación más amplia del estándar MCP.
Google ha introducido el servidor de protocolo de contexto de modelo de Data Commons (MCP), un nuevo servicio que permite a desarrolladores, científicos de datos y agentes de IA recuperar estadísticas del mundo real a través de consultas de lenguaje natural.
Google amplía el acceso a datos públicos para aplicaciones de IA
Google está convirtiendo su extenso repositorio de datos públicos en un recurso práctico para sistemas de inteligencia artificial con el debut del servidor de protocolo de contexto de modelo de Data Commons (MCP). El servicio permite a desarrolladores, científicos de datos y agentes de IA hacer preguntas en lenguaje natural y recibir estadísticas del mundo real extraídas de una colección curada de conjuntos de datos públicos.
Data Commons, lanzado originalmente en 2018, agrega información de encuestas gubernamentales, registros administrativos locales e instituciones globales como las Naciones Unidas, organizándola en un formato unificado y estructurado.
Puenteando el acceso a datos para modelos de lenguaje grande
El servidor MCP conecta este tesoro de datos con modelos de lenguaje grande (LLM) modernos aplicando el protocolo de contexto de modelo, un estándar de industria abierto introducido por primera vez por Anthropic el noviembre pasado. El protocolo permite que los sistemas de IA soliciten datos contextuales sin necesidad de conocimientos detallados de los modelos de datos subyacentes o API, permitiendo que el modelo "elija los datos adecuados en el momento adecuado". Empresas como Gemini de Google, OpenAI y Microsoft ya han incorporado el estándar MCP en sus productos.
Abordando alucinaciones de IA y brechas de capacitación
Una de las motivaciones clave detrás del servidor es combatir la tendencia de los LLM a generar información inexacta o fabricada, comúnmente conocida como alucinaciones, cuando carecen de material de fuente confiable. Al suministrar datos de alta calidad y verificables directamente de fuentes públicas confiables, el servidor MCP ayuda a fundamentar las salidas de IA en la realidad factual, reduciendo la necesidad de que los desarrolladores curaran manualmente grandes conjuntos de datos limpios para afinar. La interfaz de lenguaje natural también simplifica el proceso de integración, permitiendo que los desarrolladores de IA se centren en el rendimiento del modelo en lugar de en la mecánica de acceso a datos compleja.
Herramientas para desarrolladores y adopción temprana
Google está proporcionando varias vías para que los desarrolladores trabajen con el servidor MCP. Un kit de desarrollo de agentes (ADK) está disponible como una notebook de Colab, ofreciendo un ejemplo práctico de cómo construir un agente de IA que consulta el servidor. El servidor también se puede acceder a través de la interfaz de línea de comandos de Gemini, cualquier cliente compatible con MCP que utilice el paquete PyPI o directamente a través de ejemplos de código alojados en un repositorio público de GitHub. Estos recursos están destinados a reducir la barrera de entrada para los equipos que buscan incorporar datos del mundo real en sus pipelines de IA.
Asociación con la campaña ONE
El lanzamiento incluye una demostración práctica a través de una asociación con la campaña ONE, una organización sin fines de lucro centrada en la oportunidad económica y la salud pública en África. Juntos, crearon el agente de datos ONE, una herramienta de IA que aprovecha el servidor MCP para superficiar decenas de millones de puntos de datos financieros y de salud en lenguaje plano. La colaboración comenzó cuando la campaña ONE compartió una implementación de prototipo de MCP en su propio servidor, lo que llevó al equipo de Data Commons de Google a desarrollar un servidor MCP dedicado para un uso más amplio.
Implicaciones para el ecosistema de IA
Al hacer que los conjuntos de datos públicos estén listos para ser consultados a través de lenguaje natural, el servidor MCP de Google podría cambiar la forma en que se entrenan y evalúan los modelos de IA. El servicio ofrece una alternativa escalable y de bajo costo a los datos tradicionalmente ruidosos extraídos de la web que muchos modelos dependen, lo que podría llevar a aplicaciones de IA más precisas y confiables en sectores como las finanzas, la atención médica, la investigación climática y la política pública. A medida que más organizaciones adopten el estándar MCP, el ecosistema puede ver una convergencia hacia marcos de acceso a datos compartidos e interoperables que simplifiquen los ciclos de desarrollo de IA.