OpenAI apresenta o1, novo modelo de IA com capacidade de raciocínio lógico

Na última quinta-feira (12), a OpenIA, mundialmente conhecida pelo seu ChatGPT, lançou e apresentou um novo conceito de Inteligência Artificial. Batizado de o1, o modelo faz diversas promessas em relação a tarefas envolvendo o raciocínio lógico. Na realidade, o o1 trata-se de um conjunto de vários modelos e dois deles, o1-preview e o1-mini já estão disponíveis para usuários inscritos no ChatGPT ou no Team.

Qual a diferença entre o1 e ChatGPT?

Ao contrário do ChatGPT, o modelo o1 ainda não possui a capacidade de navegar na web ou analisar arquivos. A versão atual oferece uma experiência limitada, com a análise de imagens temporariamente desativada para ajustes. Além disso, o uso do modelo é restrito, com limites semanais de 30 mensagens para o o1-preview e 50 para o o1-mini.

O modelo também possui um preço salgado para desenvolvedores: o o1-preview custa US$ 15 por 1 milhão de tokens de entrada e US$ 60 por 1 milhão de tokens de saída.

A OpenAI destaca que o o1 é particularmente eficaz em resolver problemas matemáticos e de programação, demonstrando a capacidade de "pensar" antes de responder a consultas. O modelo é capaz de sintetizar os resultados de várias subtarefas, o que o torna útil para atividades como identificar e-mails prioritários em uma caixa de entrada jurídica ou desenvolver estratégias de marketing.

Modelo o1 desempenha tarefas mais complexas

O modelo o1 foi desenvolvido utilizando técnicas de aprendizado por reforço, o que permite que ele "pense" antes de responder, empregando uma cadeia de raciocínio interna. De acordo com Noam Brown, cientista da OpenAI, esse avanço é resultado de um novo algoritmo de otimização e de um conjunto de dados especializados em "raciocínio", que inclui literatura científica adaptada para o treinamento dos modelos.

Embora ainda não tenha sido amplamente testado, o o1 já demonstrou avanços notáveis. Em um teste de qualificação para a Olimpíada Internacional de Matemática, o o1 resolveu corretamente 83% dos problemas, em comparação com apenas 13% resolvidos pelo GPT-4o. Além disso, o modelo obteve uma classificação no percentil 89 em competições de programação online, como o Codeforces.

No entanto, o o1 possui algumas limitações. Ele pode ser mais lento para responder a certas perguntas, levando mais de 10 segundos em alguns casos. Além disso, a OpenAI decidiu não exibir as "cadeias de pensamento" completas do modelo, oferecendo apenas resumos dessas cadeias.

A expectativa é que a OpenAI disponibilize o o1 para um público mais amplo e continue a desenvolver novas versões que possam realizar raciocínios prolongados, por horas, dias ou até semanas, para aprimorar ainda mais suas capacidades.