- Pesquisadores de Stanford e da University of Washington treinaram um modelo de raciocínio concorrente ao OpenAI em apenas 26 minutos, por menos de 50 dólares.
- O modelo, chamado s1, foi desenvolvido por meio de distilação a partir do Gemini 2.0 Flash Thinking Experimental, da Google.
- Eles passaram de um conjunto de 59 mil perguntas para um conjunto de apenas 1.000 questões, treinando com 16 GPUs Nvidia H100.
- O s1 usa a técnica de “test-time scaling”, que permite mais tempo de raciocínio antes da resposta, incluindo a palavra “Wait” para revisar o raciocínio.
- A equipe afirma que o s1 supera o o1‑preview em questões de matemática, com ganho de até 27%, e discute o impacto de modelos menores na indústria de IA.
Pesquisadores treinaram um modelo de raciocínio de IA semelhante ao OpenAI em apenas 26 minutos, por menos de 50 dólares. O estudo mostrou que o modelo, chamado s1, foi refinado usando uma técnica de destilação a partir de respostas do Gemini 2.0 Flash Thinking Experimental, da Google, e um conjunto inicial de 1.000 perguntas.
O projeto envolveu pesquisadores da Stanford University e da University of Washington. A equipe usou o modelo Qwen2.5, do Alibaba Cloud, como base aberta. O treinamento ocorreu com 16 GPUs Nvidia H100, dentro de um orçamento reduzido.
A destilação permitiu que o s1 aprendesse com as respostas geradas por modelos maiores. Segundo o artigo, o processo buscou extrair capacidades de raciocínio de sistemas mais potentes sem custar caro. A equipe enfatiza que o s1 pode chegar a comparar-se com o o1 da OpenAI em tarefas de matemática.
Para melhorar o raciocínio, os pesquisadores adotaram uma técnica de escalonamento em tempo de teste, que permite ao modelo pensar por mais tempo antes de responder. A estratégia incluiu inserir a palavra Wait nas respostas para incentivar uma verificação de lógica.
O s1 é derivado ainda do Qwen2.5 e se baseou, em parte, na resposta de Gemini 2.0 ao raciocínio experimental. Google informa, em termos de serviço, que não é permitido usar APIs para desenvolver modelos que concorram com seus sistemas. A veracidade dos detalhes foi confirmada por reportagens de TechCrunch e The Verge.
Paralelamente, o estudo cita casos de outras iniciativas de IA com custos baixos. A OpenAI monitora disputas com a DeepSeek, cuja equipe afirma ter replicado técnicas de o1 a custo menor, o que gerou reclamações do fabricante. O artigo ressalta que o s1 afirma superar o o1 em questões de matemática competitiva em até 27%.
Impactos e contexto de mercado
Especialistas veem modelos menores, mais baratos e rápidos como ameaça às grandes plataformas. Eles podem reduzir a necessidade de investimentos bilionários em treinamento e em data centers com GPUs, alterando o equilíbrio entre empresas grandes e startups.
As informações sobre o desempenho do s1 surgem em meio a debate sobre acesso, propriedade intelectual e limites de uso de APIs de IA. A equipe também aponta que o distilado pode acelerar pesquisas na área, mantendo o foco na qualidade das respostas.
Fontes citadas pela reportagem indicam que o avanço não implica, por ora, a substituição completa de grandes modelos comerciais. O estudo reforça a tendência de explorar soluções acessíveis para testar capacidades de raciocínio e planejamento de IA.
Entre na conversa da comunidade