São Francisco, 24 de setembro de 2025 — O Google disponibilizou o Model Context Protocol (MCP) Server para o Data Commons, abrindo caminho para que desenvolvedores, cientistas de dados e agentes de inteligência artificial acessem estatísticas do mundo real por meio de linguagem natural.
Lançado em 2018, o Data Commons consolida bases públicas de órgãos governamentais, administrações locais e entidades internacionais, como a Organização das Nações Unidas. Com o novo servidor, essas informações podem ser consultadas por prompts em linguagem natural e integradas diretamente em aplicações de IA.
Segundo o chefe do Google Data Commons, Prem Ramaswami, o protocolo permite que grandes modelos escolham “o dado certo na hora certa” sem que o usuário precise entender a estrutura interna da plataforma ou de suas APIs.
Treinar modelos de linguagem costuma exigir conjuntos de dados amplos e confiáveis — algo raro na internet aberta, marcada por ruído e fontes não verificadas. O MCP Server pretende reduzir alucinações e oferecer contexto estruturado ao conectar bases oficiais, que vão de censos populacionais a estatísticas climáticas.
O MCP, padrão aberto criado pela Anthropic em novembro de 2024, já foi adotado por Google, OpenAI e Microsoft para integrar modelos a diversos repositórios de conteúdo. O Google iniciou o desenvolvimento do servidor dedicado em maio deste ano, após a organização ONE Campaign apresentar um protótipo que utilizava o protocolo para reunir dados financeiros e de saúde sobre a África.

Imagem: Internet
Em parceria com o Google, a ONE Campaign lançou o One Data Agent, ferramenta que explora dezenas de milhões de indicadores em linguagem simples. Como a infraestrutura é aberta, qualquer modelo de linguagem pode acessar o servidor: há um agente de exemplo no Agent Development Kit (ADK) via Colab, integração pelo Gemini CLI e suporte a clientes MCP por meio de pacote disponível no PyPI. Exemplos de código estão publicados no GitHub.
Palavras-chave: Google, Data Commons, MCP Server, Model Context Protocol, IA, dados públicos, ONE Campaign, treinamento de modelos
Com informações de TechCrunch