Os seres humanos venceram os modelos generativos de IA fabricados pelo Google e OpenAI em uma competição internacional de matemática internacional, apesar dos programas atingirem as pontuações no nível do ouro pela primeira vez.
Nenhum dos modelos obteve notas completas – ao contrário de cinco jovens na Olimpíada Matemática Internacional (IMO), uma prestigiada competição anual onde os participantes devem ter menos de 20 anos.
O Google disse na segunda -feira que uma versão avançada de seu Gemini Chatbot havia resolvido cinco dos seis problemas de matemática definidos na IMO, realizada no Queensland da Austrália este mês.
“Podemos confirmar que o Google Deepmind atingiu o marco muito desejado, ganhando 35 de 42 pontos possíveis-uma pontuação na medalha de ouro”, disse a gigante da tecnologia dos EUA, o presidente da IMO, Gregor Dolinar.
“Suas soluções foram surpreendentes em muitos aspectos. Os alunos da IMO acharam que eram claros, precisos e a maioria deles fácil de seguir”.
Cerca de 10 % dos participantes humanos ganharam medalhas de nível ouro e cinco receberam pontuações perfeitas de 42 pontos.
A fabricante de chatgpt nos EUA Openai disse que seu modelo de raciocínio experimental marcou 35 pontos no nível de ouro no teste.
O resultado “alcançou um grande desafio de longa data na IA” em “o maior concurso de matemática do mundo”, escreveu o pesquisador do Openai Alexander Wei nas mídias sociais.
“Avaliamos nossos modelos nos problemas de 2025 IMO nas mesmas regras que os concorrentes humanos”, disse ele.