Tão bom quanto o ChatGPT, requer muito menos capacidade de computação, tem código aberto e é totalmente de graça.
É o DeepSeek R1, o sistema de inteligência artificial da startup chinesa DeepSeek que está causando furor – impressionando os cientistas de computação e sendo usado nos EUA como munição nos ataques contra a OpenAI, a criadora do ChatGPT.
“O DeepSeek é um dos avanços mais impressionantes que eu vi em toda minha vida – e é open source, uma enorme dádiva para o mundo,” tuitou Marc Andreessen, o engenheiro de software que fundou a firma de venture capital Andreessen Horowitz (hoje az16) e é aliado de Elon Musk nos embates contra Sam Altman, o CEO da OpenAI.
Andreessen já havia postado o comentário do cientista de dados Jim Fan, pesquisador da Nvidia, dizendo que “estamos vivendo em um período no qual uma empresa de fora dos EUA está mantendo viva a missão original da OpenAI – uma pesquisa de ponta e verdadeira aberta, que dê capacidade a todos.”
À parte a briga envolvendo Altman e seus detratores, a DeepSeek parece representar um desafio e tanto para a estratégia dos EUA e seu complexo de Big Techs – entre outros motivos, porque a startup chinesa conseguiu o feito apesar das restrições impostas pelo governo americano às exportações para a China dos chips mais sofisticados da Nvidia.
Os chineses dizem que o desenvolvimento do modelo custou US$ 6 milhões em capacidade computacional, menos de um décimo do gasto pela Meta na elaboração de seu mais recente sistema de AI, o Llama 3.2.
Enquanto Altman e outros empreendedores americanos correm para atrair investimentos multibilionários e construir data centers gigantescos, a DeepSeek pode estar sinalizando que este esforço todo – ao menos em boa parte – talvez fosse desnecessário.
“O número de companhias que têm US$ 6 milhões para gastar é enormemente maior do que aquelas que têm US$ 100 milhões ou US$ 1 bilhão,” o investidor Chris Nicholson, da Page One Ventures, disse ao New York Times.
A declaração é óbvia – mas dá a dimensão do choque causado na indústria tech e nas firmas americanas de VC.
Enquanto as grandes dos EUA usam supercomputadores com até 16 mil chips de última geração, a DeepSeek disse que treinou seu modelo usando 2.000 chips da Nvidia – e modelos menos poderosos do que os usados nos EUA.
A empresa utilizou os chips H800, especialmente feitos para cumprir as exigências americanas de venda para o mercado chinês. Ou seja: fez mais com menos.
Sam Altman relativizou o feito.
“É (relativamente) fácil copiar algo que você sabe que funciona,” Altman postou no X. “É extremamente difícil fazer algo novo e arriscado quando você não sabe se vai funcionar.”
Que seja. Os chineses estão chegando lá.
A fundadora da startup é uma empresa chinesa de investimento quantitativo, a High-Flyer, que tem cerca de US$ 8 bilhões sob gestão.
A gestora quant foi fundada em 2015 por três engenheiros e, em 2019, investiu no desenvolvimento de inteligência artificial e na construção de supercomputadores – ferramentas usadas, a princípio, na negociação de ativos.
Em 2023, surgiu a startup DeepSeek, um negócio à parte. Como seus modelos são abertos, o desenvolvimento teve a contribuição de programadores ao redor do mundo – o que ajudou também a driblar os controles impostos pela Casa Branca ao governo chinês.
Testes comparativos analisando diferentes tarefas mostram que o DeepSeek R1 rivaliza ombro a ombro com o modelo o1, o mais avançado da OpenAI – e até bate o americano em alguns aspectos.
Satya Nadella, o CEO da Microsoft, disse que o mais recente modelo da startup chinesa é “super impressionante” e “super eficiente em computação.”
“Precisamos levar muito, muito a sério o que está acontecendo na China,” disse Nadella.
O modelo da DeepSeek está disponível na plataforma da americana Hugging Face, de desenvolvimento de aplicativos de IA, sob licença do Massachusetts Institute of Technology (MIT).
É um modelo que, como os mais sofisticados, é capaz de ‘raciocinar’ e se autocorrigir.
O bot do R1 está sujeito às regras da censura chinesa, informa uma reportagem do TechCrunch.
Se alguém lhe pedir para comentar o massacre da Paz Celestial, ele responderá algo como: “Perdão, mas não consigo falar sobre essa questão. Que tal conversarmos sobre matemática, programação e problemas de lógica?”
Mas desenvolvedores internacionais que utilizarem o modelo para criar seus próprios aplicativos não estarão sujeitos às barreiras da muralha política chinesa.
LEIA MAIS
“Eles não têm esse dinheiro,” disse Elon. “Quer ir lá ver?” retrucou Altman