Pesquisadores de Stanford e da University of Washington treinaram um modelo de raciocínio concorrente ao OpenAI em apenas 26 minutos, por menos de 50 dólares.
O modelo, chamado s1, foi desenvolvido por meio de distilação a partir do Gemini 2.0 Flash Thinking Experimental, da Google.
Eles passaram de um conjunto de 59 mil perguntas para um conjunto de apenas 1.000 questões, treinando com 16 GPUs Nvidia H100.
O s1 usa a técnica de “test-time scaling”, que permite mais tempo de raciocínio antes da resposta, incluindo a palavra “Wait” para revisar o raciocínio.
A equipe afirma que o s1 supera o o1‑preview em questões de matemática, com ganho de até 27%, e discute o impacto de modelos menores na indústria de IA.

Pesquisadores treinaram um modelo de raciocínio de IA semelhante ao OpenAI em apenas 26 minutos, por menos de 50 dólares. O estudo mostrou que o modelo, chamado s1, foi refinado usando uma técnica de destilação a partir de respostas do Gemini 2.0 Flash Thinking Experimental, da Google, e um conjunto inicial de 1.000 perguntas.

O projeto envolveu pesquisadores da Stanford University e da University of Washington. A equipe usou o modelo Qwen2.5, do Alibaba Cloud, como base aberta. O treinamento ocorreu com 16 GPUs Nvidia H100, dentro de um orçamento reduzido.

A destilação permitiu que o s1 aprendesse com as respostas geradas por modelos maiores. Segundo o artigo, o processo buscou extrair capacidades de raciocínio de sistemas mais potentes sem custar caro. A equipe enfatiza que o s1 pode chegar a comparar-se com o o1 da OpenAI em tarefas de matemática.

Para melhorar o raciocínio, os pesquisadores adotaram uma técnica de escalonamento em tempo de teste, que permite ao modelo pensar por mais tempo antes de responder. A estratégia incluiu inserir a palavra Wait nas respostas para incentivar uma verificação de lógica.

O s1 é derivado ainda do Qwen2.5 e se baseou, em parte, na resposta de Gemini 2.0 ao raciocínio experimental. Google informa, em termos de serviço, que não é permitido usar APIs para desenvolver modelos que concorram com seus sistemas. A veracidade dos detalhes foi confirmada por reportagens de TechCrunch e The Verge.

Paralelamente, o estudo cita casos de outras iniciativas de IA com custos baixos. A OpenAI monitora disputas com a DeepSeek, cuja equipe afirma ter replicado técnicas de o1 a custo menor, o que gerou reclamações do fabricante. O artigo ressalta que o s1 afirma superar o o1 em questões de matemática competitiva em até 27%.

Impactos e contexto de mercado

Especialistas veem modelos menores, mais baratos e rápidos como ameaça às grandes plataformas. Eles podem reduzir a necessidade de investimentos bilionários em treinamento e em data centers com GPUs, alterando o equilíbrio entre empresas grandes e startups.

As informações sobre o desempenho do s1 surgem em meio a debate sobre acesso, propriedade intelectual e limites de uso de APIs de IA. A equipe também aponta que o distilado pode acelerar pesquisas na área, mantendo o foco na qualidade das respostas.

Fontes citadas pela reportagem indicam que o avanço não implica, por ora, a substituição completa de grandes modelos comerciais. O estudo reforça a tendência de explorar soluções acessíveis para testar capacidades de raciocínio e planejamento de IA.

Converse com o Telinha

Pesquisadores treinam rival da OpenAI em meia hora por menos de US$50

Impactos e contexto de mercado

Relacionados:

Comentários 0

Entre na conversa da comunidade

Veja Mais

Converse com o Telinha

Pesquisadores treinam rival da OpenAI em meia hora por menos de US$50

Impactos e contexto de mercado

Relacionados:

Comentários 0

Entre na conversa da comunidade

Veja Mais

Fique por dentro das notícias do Khai Dreams