DeepSeek: A ascensão meteórica da startup chinesa de IA que está balançando o mundo da tecnologia

por Redação
Liang Wenfeng - Fundador da DeepSeek

A DeepSeek, uma startup chinesa de inteligência artificial (IA), emergiu do anonimato para se tornar um dos principais tópicos de discussão no mundo da tecnologia. Em poucos meses, a empresa conquistou o topo das paradas de download de aplicativos, abalou o mercado de ações e gerou debates sobre a competição global em IA. Mas o que exatamente é a DeepSeek e por que ela está causando tanto furor?

DeepSeek: Democratizando a IA com Código Aberto

Fundada em Hangzhou, China, em 2023, a DeepSeek é uma empresa de IA focada no desenvolvimento de Large Language Models (LLMs) de código aberto. O CEO e fundador, Liang Wenfeng, é também cofundador da High-Flyer, um fundo de hedge chinês com foco em negociação quantitativa orientada por IA . Liang Wenfeng, CEO da DeepSeek, possui vasta experiência no setor de IA, tendo co-fundado a High-Flyer, um dos principais fundos de hedge da China que se concentra em negociação quantitativa impulsionada por IA . A DeepSeek se destaca por sua abordagem open-source, disponibilizando o código de seus modelos para uso, modificação e visualização livremente . Essa estratégia, que permite a colaboração e o desenvolvimento conjunto por uma comunidade global de pesquisadores e desenvolvedores, contrasta com a de muitas empresas americanas de IA, que mantêm seus modelos em segredo.  

Produtos e Serviços:

A DeepSeek oferece uma variedade de LLMs, cada um com diferentes capacidades e aplicações. Seus principais produtos incluem:

  • DeepSeek Coder: Lançado em novembro de 2023, este modelo é voltado para tarefas de codificação e desenvolvimento de software. Disponível gratuitamente para pesquisadores e usuários comerciais, o DeepSeek Coder é licenciado sob a licença MIT, com um acordo adicional para uso “aberto e responsável” . Alguns usuários consideram o DeepSeek Coder superior ao ChatGPT para a geração de código Python .
       

  • DeepSeek LLM: Lançada no mesmo ano, esta série de modelos, com 7B e 67B parâmetros, compete com outros LLMs disponíveis na época. O DeepSeek LLM se destaca por seus resultados de benchmark, que superam a maioria dos LLMs de código aberto, especialmente o Llama 2 .   
  • DeepSeek-V2: Lançado em maio de 2024, este modelo se destaca por seu baixo custo, com um preço de 2 RMB por milhão de tokens de saída. O DeepSeek-V2 ocupa o sétimo lugar no ranking LLM da Universidade de Waterloo .   
  • DeepSeek-V3: Lançado em dezembro de 2024, este modelo possui 671 bilhões de parâmetros e foi treinado em cerca de 55 dias a um custo de US$ 5,58 milhões. Treinado em um conjunto de dados de 14,8 trilhões de tokens, o DeepSeek-V3 é uma mistura de especialistas com Multi-head Latent Attention Transformer . Para construir seus modelos recentes, incluindo o DeepSeek-V3, a DeepSeek utilizou os chips H800 da Nvidia, que possuem um desempenho inferior aos chips A100, mas não estão sujeitos às restrições de exportação impostas pelos EUA à China .  
  • DeepSeek-R1: Lançado em janeiro de 2025, este modelo de código aberto com robustas capacidades de raciocínio é comparável ao modelo o1 da OpenAI em áreas como matemática, programação e conhecimento geral, mas com um custo 90-95% menor .  

Além de seus modelos de linguagem, a DeepSeek oferece uma plataforma com interface de chat para explorar aplicações de AGI (Inteligência Artificial Geral) e APIs para integrar recursos de IA em diversas aplicações . A empresa também oferece um chatbot gratuito que se tornou o aplicativo gratuito número 1 na App Store da Apple .   

Extensões e Ferramentas:

A DeepSeek também desenvolveu uma extensão para o navegador Chrome chamada DeepSeek R1. Essa extensão permite que os usuários conversem com a IA em tempo real, acessem o histórico de conversas e otimizem seus fluxos de trabalho diretamente no navegador . A extensão oferece recursos como:   

  • Interface de chat intuitiva.
  • Criação de novos chats instantâneos.
  • Histórico de conversas.
  • Barra lateral de acesso rápido.
  • Respostas em tempo real.
  • Otimização de fluxo de trabalho.

Tecnologia e Inovação:

A DeepSeek se destaca por sua abordagem inovadora ao desenvolvimento de LLMs, com foco em “treinamento inteligente”. A empresa desenvolveu funções de recompensa altamente eficientes que identificam quais novos exemplos de treinamento realmente melhoram o modelo, evitando o desperdício de recursos computacionais em dados redundantes . Essa abordagem permite que a DeepSeek treine seus modelos de forma mais rápida e eficiente, com menos dados e recursos computacionais.   

Impacto no Mercado:

O lançamento do DeepSeek-R1 causou ondas de choque no mercado de ações, derrubando as ações de empresas como Nvidia, Constellation Energy e Eaton . O Nasdaq Composite, índice que concentra empresas de tecnologia, despencou em 27 de janeiro de 2025 em meio a temores de que a DeepSeek pudesse prejudicar a Nvidia e outras empresas que investiram bilhões no desenvolvimento de chips e ferramentas de IA . O sucesso da DeepSeek em desenvolver modelos de IA de alto desempenho a um custo significativamente menor que seus concorrentes americanos levantou preocupações sobre a lucratividade e a liderança do mercado de IA . O desenvolvimento do DeepSeek-R1, por exemplo, custou apenas US$ 6 milhões, enquanto o desenvolvimento de modelos semelhantes por empresas americanas pode chegar a bilhões de dólares . Essa disrupção no mercado de IA é ainda mais significativa considerando que a Bloomberg Professional Services prevê que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032 .  

Presença Online e Mídias Sociais:

A DeepSeek tem uma forte presença online, com um site oficial que fornece informações sobre a empresa, seus produtos e serviços . A empresa também está presente em plataformas de mídia social como X (anteriormente Twitter) e WeChat, onde compartilha atualizações e se envolve com a comunidade de IA . O chatbot da DeepSeek inclui um recurso de pesquisa de IA que permite aos usuários pesquisar na web usando prompts de conversação . Essa funcionalidade inovadora oferece uma nova maneira de interagir com as informações online, tornando a pesquisa mais intuitiva e eficiente. O lançamento do DeepSeek-R1 gerou um frenesi nas mídias sociais, com usuários compartilhando memes e comentários sobre a ascensão da empresa e seu impacto na indústria de IA .   

Controvérsias:

Apesar de seu sucesso, a DeepSeek também enfrentou algumas controvérsias. A empresa foi alvo de “ataques maliciosos em larga escala” que interromperam seus serviços e limitaram o registro de novos usuários . Além disso, alguns usuários relataram que o chatbot da DeepSeek parece bloquear respostas sobre o Partido Comunista Chinês e tópicos politicamente sensíveis, como o massacre da Praça da Paz Celestial e a perseguição aos uigures . Em testes realizados, o chatbot da DeepSeek apresentou o mesmo erro básico que seus concorrentes ocidentais em um teste de loop for em C++ . Essas preocupações com censura e vieses políticos levantam questões sobre a confiabilidade e a neutralidade da IA desenvolvida pela DeepSeek. Além disso, a DeepSeek coleta certas informações dos usuários, incluindo modelo do dispositivo, sistema operacional, padrões de digitação, endereço IP e idioma do sistema, juntamente com informações de diagnóstico e desempenho, relatórios de falhas e logs de desempenho . Essa coleta de dados levanta preocupações sobre a privacidade dos usuários e o uso que a DeepSeek faz dessas informações.   

Concorrentes:

A DeepSeek compete com uma série de empresas de IA, cada uma com seus próprios pontos fortes e fracos. Alguns dos principais concorrentes da DeepSeek incluem:

  • Linker Lianhui: Uma empresa chinesa especializada em tecnologia de IA, que oferece uma variedade de plataformas e soluções orientadas por IA .   
  • CodeGPT: Uma plataforma SaaS que oferece um assistente de código baseado em IA e uma API de baixo código para ajudar no desenvolvimento de soluções de IA personalizadas .   
  • NeaChat: Uma plataforma de IA avançada com foco em soluções de educação inteligente, que oferece suporte personalizado para aprendizagem e geração de conteúdo educacional .   
  • SmoothAI: Uma empresa de IA focada na criação de produtos de IA fáceis de usar, com o objetivo de simplificar a integração e o uso da IA em diversas aplicações .   
  • AgentLabs: Uma empresa que fornece front-ends de assistente de IA como serviço, transformando código de servidor em aplicativos baseados em chat para facilitar a criação de agentes de IA autônomos .   
  • TawkitAI: Uma empresa especializada no desenvolvimento de infraestrutura de copiloto, oferecendo uma solução plug-and-play para conectar copilotos e aplicativos, além de fornecer um substituto para textarea com recursos de autocompletar, inserções e edições .   
  • Superflows: Uma empresa que integra assistentes de IA em produtos de software SaaS, permitindo que os usuários interajam com seus softwares por meio de uma interface de chat orientada por IA .   
  • Argos Labs: Uma empresa especializada em plataformas de desenvolvimento de baixo código com foco na integração de IA, aprendizado de máquina e soluções de ciência de dados. Seus principais produtos incluem uma plataforma Python de baixo código e um SDK Python-to-Operations Toolset (POT) .   
  • Kunlunxin: Uma empresa chinesa que projeta e produz chips de IA, incluindo chips de IA, placas aceleradoras de IA e outras tecnologias de hardware para IA .
       
  • OpenAI: Criadora do ChatGPT, uma das empresas líderes em IA generativa.
  • Google: Desenvolvedora do Bard (Gemini), outro grande player no mercado de LLMs.
  • Meta: Criadora do Llama, um modelo de linguagem de código aberto que a DeepSeek utilizou como base para seus próprios modelos.
  • Anthropic: Criadora do Claude, um chatbot de IA com foco em segurança e confiabilidade .   
  • Mistral AI: Desenvolvedora dos modelos Mathstral e Codestral Mamba, focados em raciocínio matemático e geração de código, respectivamente . 
  • Linker Lianhui: Uma empresa chinesa especializada em tecnologia de IA, que oferece uma variedade de plataformas e soluções orientadas por IA .   
  • CodeGPT: Uma plataforma SaaS que oferece um assistente de código baseado em IA e uma API de baixo código para ajudar no desenvolvimento de soluções de IA personalizadas .   
  • NeaChat: Uma plataforma de IA avançada com foco em soluções de educação inteligente, que oferece suporte personalizado para aprendizagem e geração de conteúdo educacional .   
  • SmoothAI: Uma empresa de IA focada na criação de produtos de IA fáceis de usar, com o objetivo de simplificar a integração e o uso da IA em diversas aplicações .   
  • AgentLabs: Uma empresa que fornece front-ends de assistente de IA como serviço, transformando código de servidor em aplicativos baseados em chat para facilitar a criação de agentes de IA autônomos .   
  • TawkitAI: Uma empresa especializada no desenvolvimento de infraestrutura de copiloto, oferecendo uma solução plug-and-play para conectar copilotos e aplicativos, além de fornecer um substituto para textarea com recursos de autocompletar, inserções e edições .   
  • Superflows: Uma empresa que integra assistentes de IA em produtos de software SaaS, permitindo que os usuários interajam com seus softwares por meio de uma interface de chat orientada por IA .   
  • Argos Labs: Uma empresa especializada em plataformas de desenvolvimento de baixo código com foco na integração de IA, aprendizado de máquina e soluções de ciência de dados. Seus principais produtos incluem uma plataforma Python de baixo código e um SDK Python-to-Operations Toolset (POT) .   
  • Kunlunxin: Uma empresa chinesa que projeta e produz chips de IA, incluindo chips de IA, placas aceleradoras de IA e outras tecnologias de hardware para IA .

Conclusões e Perspectivas Futuras:

A DeepSeek representa um novo capítulo na corrida global pela IA. Sua abordagem open-source, combinada com o desenvolvimento de modelos de alto desempenho a baixo custo, está desafiando as empresas americanas de IA e redefinindo o cenário da indústria. O sucesso da DeepSeek demonstra que a pesquisa de IA de ponta não depende necessariamente dos hardwares mais avançados, como evidenciado pelo uso de chips H800 menos potentes pela empresa . A empresa está atraindo a atenção de desenvolvedores, pesquisadores e investidores, e seu futuro parece promissor. No entanto, a DeepSeek precisa superar os desafios relacionados à segurança cibernética, às preocupações com censura e vieses políticos, e à privacidade dos dados dos usuários para consolidar sua posição como líder global em IA.   

Insights Chave:

Insight Descrição
Democratização da IA A DeepSeek está tornando a IA mais acessível, disponibilizando seus modelos de código aberto gratuitamente.
Eficiência em Custos A empresa está desafiando a noção de que o desenvolvimento de IA de ponta requer investimentos massivos, com o DeepSeek R1 alcançando desempenho comparável ao ChatGPT e Gemini com mais de 95% de economia .
Competição Global A ascensão da DeepSeek intensifica a competição entre EUA e China no campo da IA.
Censura e Segurança A DeepSeek precisa lidar com as preocupações sobre censura e segurança cibernética para garantir a confiança dos usuários.
Inovação Contínua A DeepSeek está impulsionando a inovação em IA com seus modelos de alto desempenho e baixo custo.

Síntese:

A DeepSeek, uma startup chinesa de IA, está rapidamente se tornando uma força disruptiva na indústria global de IA. Seu foco em modelos de código aberto, baixo custo e alto desempenho está desafiando as gigantes de tecnologia americanas e democratizando o acesso à IA. A empresa já alcançou resultados impressionantes, com seus modelos superando benchmarks e seu chatbot alcançando o topo das paradas de download de aplicativos. No entanto, a DeepSeek enfrenta desafios relacionados à censura, segurança cibernética e privacidade de dados. O sucesso futuro da empresa dependerá de sua capacidade de superar esses desafios e manter seu ritmo de inovação. A ascensão da DeepSeek destaca a crescente competição global em IA e o papel cada vez mais importante da China nesse cenário. A empresa é um exemplo de como a inovação pode surgir de lugares inesperados e desafiar as normas estabelecidas. O futuro da IA ​​está sendo moldado por empresas como a DeepSeek, que estão impulsionando os limites da tecnologia e tornando-a mais acessível a todos.

Você também pode gostar

Mantenha contato

Não perca a oportunidade de estar sempre conectado ao que importa! Mantenha contato com a gente e receba conteúdos exclusivos, dicas imperdíveis e as últimas novidades. Fique ligado e junte-se a nós para não perder nada!

Get in touch

[contact-form-7 id='564' title='Contact']

Copyright @2024 – Todos os direitos reservados!

Compartilhe