Thinking Machines Lab mira em respostas mais consistentes para modelos de IA

Date:

A Thinking Machines Lab, liderada pela ex-CTO da OpenAI Mira Murati, divulgou nesta quarta-feira (10) seu primeiro estudo público com o objetivo de reduzir a aleatoriedade nas respostas de modelos de linguagem. O texto marca o lançamento do blog de pesquisa Connectionism da startup, que já captou US$ 2 bilhões em rodada seed e reúne ex-pesquisadores da OpenAI.

Controle de GPU para eliminar o “efeito roleta”

Assinado pelo pesquisador Horace He, o artigo “Defeating Nondeterminism in LLM Inference” aponta que a origem das variações de respostas está na forma como os kernels de GPU — pequenos programas executados nos chips da Nvidia — são organizados durante a inferência. Segundo He, ao orquestrar esses kernels de maneira precisa é possível tornar os modelos mais determinísticos, entregando a mesma saída para a mesma entrada.

Impacto em empresas e no treino por reforço

Além de oferecer previsibilidade para cientistas e clientes corporativos, a equipe afirma que a consistência pode melhorar o treinamento por reforço (reinforcement learning). Como esse método recompensa respostas corretas, variações mínimas acabam introduzindo ruído nos dados de treino; respostas mais uniformes tornariam o processo “mais suave”, de acordo com o pesquisador.

Próximos passos e promessa de transparência

Mira Murati declarou em julho que o primeiro produto da Thinking Machines Lab será apresentado nos próximos meses, com foco em pesquisadores e startups que desenvolvem modelos customizados. A empresa, avaliada em US$ 12 bilhões, também se comprometeu a publicar regularmente códigos, artigos e detalhes de seus avanços.

Thinking Machines Lab mira em respostas mais consistentes para modelos de IA - Imagem do artigo original

Imagem: Getty

Este primeiro post oferece uma rara visão interna de uma das startups de IA mais discretas do Vale do Silício, indicando que a companhia pretende atacar alguns dos maiores desafios do setor.

Com informações de TechCrunch

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui

Share post:

Subscribe

spot_imgspot_img

Popular

More like this
Related

Justiça dos EUA mantém DJI em lista do Pentágono de empresas ligadas às Forças Armadas chinesas

Washington (EUA) – Um juiz federal rejeitou o pedido...

CEO da Oura avalia possível IPO e diz que privacidade de dados é “inegociável”

A Oura Health já reúne tamanho, escala e crescimento...

Investidores de risco veem na IA caminho para margens de software em serviços tradicionais, mas desafios aparecem

Venture capitalistas passaram a mirar empresas de serviços tradicionais...

Edson Fachin assume comando do STF sob tensão com Congresso e Estados Unidos

O ministro Edson Fachin toma posse nesta segunda-feira (29),...