A Anthropic anunciou o lançamento do Claude 3.7 Sonnet, modelo de inteligência artificial (IA) projetado para oferecer diferentes níveis de raciocínio, adaptando-se à necessidade do usuário. A empresa destaca que este é o primeiro modelo de “raciocínio híbrido” da indústria, combinando respostas rápidas com análises mais aprofundadas em uma única plataforma.
A novidade elimina a complexidade dos atuais sistemas de IA que obrigam os usuários a escolher entre diferentes modelos com custos e capacidades variadas. Com o Claude 3.7 Sonnet, a Anthropic busca simplificar essa experiência, permitindo que um único modelo atenda a diversas demandas.
O modelo já está disponível para todos os usuários e desenvolvedores, mas apenas aqueles com planos premium do chatbot Claude terão acesso às funções avançadas de raciocínio. Usuários da versão gratuita poderão utilizar a versão padrão do Claude 3.7 Sonnet, que, segundo a empresa, supera seu antecessor, o Claude 3.5 Sonnet.
Leia também: OpenAI descobre ferramenta chinesa de vigilância baseada em IA
Custo e concorrentes
De acordo com informações do TechCrunch, o custo do Claude 3.7 Sonnet é de US$ 3 por milhão de tokens de entrada (o equivalente a cerca de 750 mil palavras) e US$ 15 por milhão de tokens de saída. Esse valor é mais alto que concorrentes como o o3-mini, da OpenAI (US$ 1,10 por milhão de tokens de entrada e US$ 4,40 por milhão de tokens de saída), e o R1, da DeepSeek (US$ 0,55 por milhão de tokens de entrada e US$ 2,19 por milhão de tokens de saída). Entretanto, ao contrário desses modelos, o Claude 3.7 Sonnet integra capacidades híbridas de raciocínio.
Como funciona o raciocínio híbrido?
Inspirado no processo de dedução, Claude 3.7 Sonnet pode dividir problemas em etapas menores, melhorando a precisão das respostas. Esse conceito de IA com raciocínio é uma aposta crescente no setor, com exemplos como o Gemini 2.0 Flash Thinking, do Google, e o Grok 3 (Think), da xAI.
Futuramente, a Anthropic planeja que o modelo ajuste automaticamente o tempo necessário para processar uma resposta, sem que o usuário precise definir isso manualmente. “Assim como humanos não têm dois cérebros separados para perguntas rápidas e complexas, acreditamos que o raciocínio deve ser uma capacidade integrada do modelo”, afirmou a empresa em comunicado.
Para tornar o processo mais transparente, Claude 3.7 Sonnet traz um recurso chamado “scratch pad visível”, onde o usuário pode acompanhar o planejamento interno da IA antes da resposta final. No entanto, partes desse processo podem ser ocultadas por questões de segurança e confiança.
Desempenho e aplicações
Os aprimoramentos no raciocínio do Claude 3.7 Sonnet foram otimizados para tarefas do mundo real, como resolução de problemas complexos de programação e automação de tarefas. Em testes, o modelo obteve 62,3% de precisão no benchmark SWE-Bench para desafios de codificação, superando os 49,3% do o3-mini, da OpenAI. Já no teste TAU-Bench, que avalia a interação da IA com usuários e APIs no varejo, Claude 3.7 Sonnet registrou 81,2%, contra 73,5% do modelo o1 da OpenAI.
A Anthropic também destaca avanços na moderação de conteúdo, reduzindo em 45% o número de recusas desnecessárias em comparação com a versão anterior. Isso ocorre em um momento em que algumas empresas de IA reconsideram as restrições de seus chatbots.
Lançamento do Claude Code
Junto ao novo modelo, a Anthropic apresentou o Claude Code, uma ferramenta experimental para desenvolvedores que permite executar comandos diretamente do terminal. A funcionalidade permite a análise de projetos, modificação de código e testes automatizados de maneira intuitiva.
Disponível inicialmente para um grupo limitado de usuários, o Claude Code promete facilitar o desenvolvimento de software com IA eliminando a necessidade de comandos complexos para interagir com um código.
Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!