DeepSeek: A ascensão meteórica da startup chinesa de IA que está balançando o mundo da tecnologia

Liang Wenfeng - Fundador da DeepSeek

A DeepSeek, uma startup chinesa de inteligência artificial (IA), emergiu do anonimato para se tornar um dos principais tópicos de discussão no mundo da tecnologia. Em poucos meses, a empresa conquistou o topo das paradas de download de aplicativos, abalou o mercado de ações e gerou debates sobre a competição global em IA. Mas o que exatamente é a DeepSeek e por que ela está causando tanto furor?

DeepSeek: Democratizando a IA com Código Aberto

Fundada em Hangzhou, China, em 2023, a DeepSeek é uma empresa de IA focada no desenvolvimento de Large Language Models (LLMs) de código aberto. O CEO e fundador, Liang Wenfeng, é também cofundador da High-Flyer, um fundo de hedge chinês com foco em negociação quantitativa orientada por IA . Liang Wenfeng, CEO da DeepSeek, possui vasta experiência no setor de IA, tendo co-fundado a High-Flyer, um dos principais fundos de hedge da China que se concentra em negociação quantitativa impulsionada por IA . A DeepSeek se destaca por sua abordagem open-source, disponibilizando o código de seus modelos para uso, modificação e visualização livremente . Essa estratégia, que permite a colaboração e o desenvolvimento conjunto por uma comunidade global de pesquisadores e desenvolvedores, contrasta com a de muitas empresas americanas de IA, que mantêm seus modelos em segredo.  

Produtos e Serviços:

A DeepSeek oferece uma variedade de LLMs, cada um com diferentes capacidades e aplicações. Seus principais produtos incluem:

  • DeepSeek Coder: Lançado em novembro de 2023, este modelo é voltado para tarefas de codificação e desenvolvimento de software. Disponível gratuitamente para pesquisadores e usuários comerciais, o DeepSeek Coder é licenciado sob a licença MIT, com um acordo adicional para uso “aberto e responsável” . Alguns usuários consideram o DeepSeek Coder superior ao ChatGPT para a geração de código Python .
       
  • DeepSeek LLM: Lançada no mesmo ano, esta série de modelos, com 7B e 67B parâmetros, compete com outros LLMs disponíveis na época. O DeepSeek LLM se destaca por seus resultados de benchmark, que superam a maioria dos LLMs de código aberto, especialmente o Llama 2 .   
  • DeepSeek-V2: Lançado em maio de 2024, este modelo se destaca por seu baixo custo, com um preço de 2 RMB por milhão de tokens de saída. O DeepSeek-V2 ocupa o sétimo lugar no ranking LLM da Universidade de Waterloo .   
  • DeepSeek-V3: Lançado em dezembro de 2024, este modelo possui 671 bilhões de parâmetros e foi treinado em cerca de 55 dias a um custo de US$ 5,58 milhões. Treinado em um conjunto de dados de 14,8 trilhões de tokens, o DeepSeek-V3 é uma mistura de especialistas com Multi-head Latent Attention Transformer . Para construir seus modelos recentes, incluindo o DeepSeek-V3, a DeepSeek utilizou os chips H800 da Nvidia, que possuem um desempenho inferior aos chips A100, mas não estão sujeitos às restrições de exportação impostas pelos EUA à China .  
  • DeepSeek-R1: Lançado em janeiro de 2025, este modelo de código aberto com robustas capacidades de raciocínio é comparável ao modelo o1 da OpenAI em áreas como matemática, programação e conhecimento geral, mas com um custo 90-95% menor .  

Além de seus modelos de linguagem, a DeepSeek oferece uma plataforma com interface de chat para explorar aplicações de AGI (Inteligência Artificial Geral) e APIs para integrar recursos de IA em diversas aplicações . A empresa também oferece um chatbot gratuito que se tornou o aplicativo gratuito número 1 na App Store da Apple .   

Extensões e Ferramentas:

A DeepSeek também desenvolveu uma extensão para o navegador Chrome chamada DeepSeek R1. Essa extensão permite que os usuários conversem com a IA em tempo real, acessem o histórico de conversas e otimizem seus fluxos de trabalho diretamente no navegador . A extensão oferece recursos como:   

  • Interface de chat intuitiva.
  • Criação de novos chats instantâneos.
  • Histórico de conversas.
  • Barra lateral de acesso rápido.
  • Respostas em tempo real.
  • Otimização de fluxo de trabalho.

Tecnologia e Inovação:

A DeepSeek se destaca por sua abordagem inovadora ao desenvolvimento de LLMs, com foco em “treinamento inteligente”. A empresa desenvolveu funções de recompensa altamente eficientes que identificam quais novos exemplos de treinamento realmente melhoram o modelo, evitando o desperdício de recursos computacionais em dados redundantes . Essa abordagem permite que a DeepSeek treine seus modelos de forma mais rápida e eficiente, com menos dados e recursos computacionais.   

Impacto no Mercado:

O lançamento do DeepSeek-R1 causou ondas de choque no mercado de ações, derrubando as ações de empresas como Nvidia, Constellation Energy e Eaton . O Nasdaq Composite, índice que concentra empresas de tecnologia, despencou em 27 de janeiro de 2025 em meio a temores de que a DeepSeek pudesse prejudicar a Nvidia e outras empresas que investiram bilhões no desenvolvimento de chips e ferramentas de IA . O sucesso da DeepSeek em desenvolver modelos de IA de alto desempenho a um custo significativamente menor que seus concorrentes americanos levantou preocupações sobre a lucratividade e a liderança do mercado de IA . O desenvolvimento do DeepSeek-R1, por exemplo, custou apenas US$ 6 milhões, enquanto o desenvolvimento de modelos semelhantes por empresas americanas pode chegar a bilhões de dólares . Essa disrupção no mercado de IA é ainda mais significativa considerando que a Bloomberg Professional Services prevê que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032 .  

Presença Online e Mídias Sociais:

A DeepSeek tem uma forte presença online, com um site oficial que fornece informações sobre a empresa, seus produtos e serviços . A empresa também está presente em plataformas de mídia social como X (anteriormente Twitter) e WeChat, onde compartilha atualizações e se envolve com a comunidade de IA . O chatbot da DeepSeek inclui um recurso de pesquisa de IA que permite aos usuários pesquisar na web usando prompts de conversação . Essa funcionalidade inovadora oferece uma nova maneira de interagir com as informações online, tornando a pesquisa mais intuitiva e eficiente. O lançamento do DeepSeek-R1 gerou um frenesi nas mídias sociais, com usuários compartilhando memes e comentários sobre a ascensão da empresa e seu impacto na indústria de IA .   

Controvérsias:

Apesar de seu sucesso, a DeepSeek também enfrentou algumas controvérsias. A empresa foi alvo de “ataques maliciosos em larga escala” que interromperam seus serviços e limitaram o registro de novos usuários . Além disso, alguns usuários relataram que o chatbot da DeepSeek parece bloquear respostas sobre o Partido Comunista Chinês e tópicos politicamente sensíveis, como o massacre da Praça da Paz Celestial e a perseguição aos uigures . Em testes realizados, o chatbot da DeepSeek apresentou o mesmo erro básico que seus concorrentes ocidentais em um teste de loop for em C++ . Essas preocupações com censura e vieses políticos levantam questões sobre a confiabilidade e a neutralidade da IA desenvolvida pela DeepSeek. Além disso, a DeepSeek coleta certas informações dos usuários, incluindo modelo do dispositivo, sistema operacional, padrões de digitação, endereço IP e idioma do sistema, juntamente com informações de diagnóstico e desempenho, relatórios de falhas e logs de desempenho . Essa coleta de dados levanta preocupações sobre a privacidade dos usuários e o uso que a DeepSeek faz dessas informações.   

Concorrentes:

A DeepSeek compete com uma série de empresas de IA, cada uma com seus próprios pontos fortes e fracos. Alguns dos principais concorrentes da DeepSeek incluem:

  • Linker Lianhui: Uma empresa chinesa especializada em tecnologia de IA, que oferece uma variedade de plataformas e soluções orientadas por IA .   
  • CodeGPT: Uma plataforma SaaS que oferece um assistente de código baseado em IA e uma API de baixo código para ajudar no desenvolvimento de soluções de IA personalizadas .   
  • NeaChat: Uma plataforma de IA avançada com foco em soluções de educação inteligente, que oferece suporte personalizado para aprendizagem e geração de conteúdo educacional .   
  • SmoothAI: Uma empresa de IA focada na criação de produtos de IA fáceis de usar, com o objetivo de simplificar a integração e o uso da IA em diversas aplicações .   
  • AgentLabs: Uma empresa que fornece front-ends de assistente de IA como serviço, transformando código de servidor em aplicativos baseados em chat para facilitar a criação de agentes de IA autônomos .   
  • TawkitAI: Uma empresa especializada no desenvolvimento de infraestrutura de copiloto, oferecendo uma solução plug-and-play para conectar copilotos e aplicativos, além de fornecer um substituto para textarea com recursos de autocompletar, inserções e edições .   
  • Superflows: Uma empresa que integra assistentes de IA em produtos de software SaaS, permitindo que os usuários interajam com seus softwares por meio de uma interface de chat orientada por IA .   
  • Argos Labs: Uma empresa especializada em plataformas de desenvolvimento de baixo código com foco na integração de IA, aprendizado de máquina e soluções de ciência de dados. Seus principais produtos incluem uma plataforma Python de baixo código e um SDK Python-to-Operations Toolset (POT) .   
  • Kunlunxin: Uma empresa chinesa que projeta e produz chips de IA, incluindo chips de IA, placas aceleradoras de IA e outras tecnologias de hardware para IA .
       
  • OpenAI: Criadora do ChatGPT, uma das empresas líderes em IA generativa.
  • Google: Desenvolvedora do Bard (Gemini), outro grande player no mercado de LLMs.
  • Meta: Criadora do Llama, um modelo de linguagem de código aberto que a DeepSeek utilizou como base para seus próprios modelos.
  • Anthropic: Criadora do Claude, um chatbot de IA com foco em segurança e confiabilidade .   
  • Mistral AI: Desenvolvedora dos modelos Mathstral e Codestral Mamba, focados em raciocínio matemático e geração de código, respectivamente . 
  • Linker Lianhui: Uma empresa chinesa especializada em tecnologia de IA, que oferece uma variedade de plataformas e soluções orientadas por IA .   
  • CodeGPT: Uma plataforma SaaS que oferece um assistente de código baseado em IA e uma API de baixo código para ajudar no desenvolvimento de soluções de IA personalizadas .   
  • NeaChat: Uma plataforma de IA avançada com foco em soluções de educação inteligente, que oferece suporte personalizado para aprendizagem e geração de conteúdo educacional .   
  • SmoothAI: Uma empresa de IA focada na criação de produtos de IA fáceis de usar, com o objetivo de simplificar a integração e o uso da IA em diversas aplicações .   
  • AgentLabs: Uma empresa que fornece front-ends de assistente de IA como serviço, transformando código de servidor em aplicativos baseados em chat para facilitar a criação de agentes de IA autônomos .   
  • TawkitAI: Uma empresa especializada no desenvolvimento de infraestrutura de copiloto, oferecendo uma solução plug-and-play para conectar copilotos e aplicativos, além de fornecer um substituto para textarea com recursos de autocompletar, inserções e edições .   
  • Superflows: Uma empresa que integra assistentes de IA em produtos de software SaaS, permitindo que os usuários interajam com seus softwares por meio de uma interface de chat orientada por IA .   
  • Argos Labs: Uma empresa especializada em plataformas de desenvolvimento de baixo código com foco na integração de IA, aprendizado de máquina e soluções de ciência de dados. Seus principais produtos incluem uma plataforma Python de baixo código e um SDK Python-to-Operations Toolset (POT) .   
  • Kunlunxin: Uma empresa chinesa que projeta e produz chips de IA, incluindo chips de IA, placas aceleradoras de IA e outras tecnologias de hardware para IA .

Conclusões e Perspectivas Futuras:

A DeepSeek representa um novo capítulo na corrida global pela IA. Sua abordagem open-source, combinada com o desenvolvimento de modelos de alto desempenho a baixo custo, está desafiando as empresas americanas de IA e redefinindo o cenário da indústria. O sucesso da DeepSeek demonstra que a pesquisa de IA de ponta não depende necessariamente dos hardwares mais avançados, como evidenciado pelo uso de chips H800 menos potentes pela empresa . A empresa está atraindo a atenção de desenvolvedores, pesquisadores e investidores, e seu futuro parece promissor. No entanto, a DeepSeek precisa superar os desafios relacionados à segurança cibernética, às preocupações com censura e vieses políticos, e à privacidade dos dados dos usuários para consolidar sua posição como líder global em IA.   

Insights Chave:

Insight Descrição
Democratização da IA A DeepSeek está tornando a IA mais acessível, disponibilizando seus modelos de código aberto gratuitamente.
Eficiência em Custos A empresa está desafiando a noção de que o desenvolvimento de IA de ponta requer investimentos massivos, com o DeepSeek R1 alcançando desempenho comparável ao ChatGPT e Gemini com mais de 95% de economia .
Competição Global A ascensão da DeepSeek intensifica a competição entre EUA e China no campo da IA.
Censura e Segurança A DeepSeek precisa lidar com as preocupações sobre censura e segurança cibernética para garantir a confiança dos usuários.
Inovação Contínua A DeepSeek está impulsionando a inovação em IA com seus modelos de alto desempenho e baixo custo.

Síntese:

A DeepSeek, uma startup chinesa de IA, está rapidamente se tornando uma força disruptiva na indústria global de IA. Seu foco em modelos de código aberto, baixo custo e alto desempenho está desafiando as gigantes de tecnologia americanas e democratizando o acesso à IA. A empresa já alcançou resultados impressionantes, com seus modelos superando benchmarks e seu chatbot alcançando o topo das paradas de download de aplicativos. No entanto, a DeepSeek enfrenta desafios relacionados à censura, segurança cibernética e privacidade de dados. O sucesso futuro da empresa dependerá de sua capacidade de superar esses desafios e manter seu ritmo de inovação. A ascensão da DeepSeek destaca a crescente competição global em IA e o papel cada vez mais importante da China nesse cenário. A empresa é um exemplo de como a inovação pode surgir de lugares inesperados e desafiar as normas estabelecidas. O futuro da IA ​​está sendo moldado por empresas como a DeepSeek, que estão impulsionando os limites da tecnologia e tornando-a mais acessível a todos.

Related posts

Clube do Ser realiza mais uma edição no Rio de Janeiro

Escritas Subversivas – Substantivo Feminino estreia festival que transforma a Praça dos Direitos Humanos em um polo de celebração da literatura produzida por mulheres periféricas

Com presença de Carol Barcellos, embaixadora, Luta Pela Paz celebra 25 anos em festa no Museu de Arte do Rio