DeepSeek: como os chineses deram a volta nas Big Techs na corrida da AI

Tão bom quanto o ChatGPT, requer muito menos capacidade de computação, tem código aberto e é totalmente de graça.

É o DeepSeek R1, o sistema de inteligência artificial da startup chinesa DeepSeek que está causando furor – impressionando os cientistas de computação e sendo usado nos EUA como munição nos ataques contra a OpenAI, a criadora do ChatGPT.

“O DeepSeek é um dos avanços mais impressionantes que eu vi em toda minha vida – e é open source, uma enorme dádiva para o mundo,” tuitou Marc Andreessen, o engenheiro de software que fundou a firma de venture capital Andreessen Horowitz (hoje a16z) e é aliado de Elon Musk nos embates contra Sam Altman, o CEO da OpenAI.

Andreessen já havia postado o comentário do cientista de dados Jim Fan, pesquisador da Nvidia, dizendo que “estamos vivendo em um período no qual uma empresa de fora dos EUA está mantendo viva a missão original da OpenAI – uma pesquisa de ponta e verdadeira aberta, que dê capacidade a todos.”

À parte a briga envolvendo Altman e seus detratores, a DeepSeek parece representar um desafio e tanto para a estratégia dos EUA e seu complexo de Big Techs – entre outros motivos, porque a startup chinesa conseguiu o feito apesar das restrições impostas pelo governo americano às exportações para a China dos chips mais sofisticados da Nvidia.

Os chineses dizem que o desenvolvimento do modelo custou US$ 6 milhões em capacidade computacional, menos de um décimo do gasto pela Meta na elaboração de seu mais recente sistema de AI, o Llama 3.2.

Enquanto Altman e outros empreendedores americanos correm para atrair investimentos multibilionários e construir data centers gigantescos, a DeepSeek pode estar sinalizando que este esforço todo – ao menos em boa parte – talvez fosse desnecessário.

“O número de companhias que têm US$ 6 milhões para gastar é enormemente maior do que aquelas que têm US$ 100 milhões ou US$ 1 bilhão,” o investidor Chris Nicholson, da Page One Ventures, disse ao New York Times.

A declaração é óbvia – mas dá a dimensão do choque causado na indústria tech e nas firmas americanas de VC.

Enquanto as grandes dos EUA usam supercomputadores com até 16 mil chips de última geração, a DeepSeek disse que treinou seu modelo usando 2.000 chips da Nvidia – e modelos menos poderosos do que os usados nos EUA.

A empresa utilizou os chips H800, especialmente feitos para cumprir as exigências americanas de venda para o mercado chinês. Ou seja: fez mais com menos.

Sam Altman relativizou o feito.

“É (relativamente) fácil copiar algo que você sabe que funciona,” Altman postou no X. “É extremamente difícil fazer algo novo e arriscado quando você não sabe se vai funcionar.”

Que seja. Os chineses estão chegando lá.

A fundadora da startup é uma empresa chinesa de investimento quantitativo, a High-Flyer, que tem cerca de US$ 8 bilhões sob gestão.

A gestora quant foi fundada em 2015 por três engenheiros e, em 2019, investiu no desenvolvimento de inteligência artificial e na construção de supercomputadores – ferramentas usadas, a princípio, na negociação de ativos.

Em 2023, surgiu a startup DeepSeek, um negócio à parte. Como seus modelos são abertos, o desenvolvimento teve a contribuição de programadores ao redor do mundo – o que ajudou também a driblar os controles impostos pela Casa Branca ao governo chinês.

Testes comparativos analisando diferentes tarefas mostram que o DeepSeek R1 rivaliza ombro a ombro com o modelo o1, o mais avançado da OpenAI – e até bate o americano em alguns aspectos.

Satya Nadella, o CEO da Microsoft, disse que o mais recente modelo da startup chinesa é “super impressionante” e “super eficiente em computação.”

“Precisamos levar muito, muito a sério o que está acontecendo na China,” disse Nadella.

O modelo da DeepSeek está disponível na plataforma da americana Hugging Face, de desenvolvimento de aplicativos de IA, sob licença do Massachusetts Institute of Technology (MIT).

É um modelo que, como os mais sofisticados, é capaz de ‘raciocinar’ e se autocorrigir.

O bot do R1 está sujeito às regras da censura chinesa, informa uma reportagem do TechCrunch.

Se alguém lhe pedir para comentar o massacre da Paz Celestial, ele responderá algo como: “Perdão, mas não consigo falar sobre essa questão. Que tal conversarmos sobre matemática, programação e problemas de lógica?”

Mas desenvolvedores internacionais que utilizarem o modelo para criar seus próprios aplicativos não estarão sujeitos às barreiras da muralha política chinesa.