Saiba tudo sobre o DeepSeek em 8 perguntas e respostas
Notícias do surgimento de novos modelos de IA generativa, tem sido comuns, no entanto, a chegada de mais um novo nome, causou estragos no setor e está dando o que falar – o DeepSeek.
Quer entender o que é e porque o mercado foi incomodado de modo tão intenso?
Vem com a gente desvendar o que é DeepSeek e porque vem causando tanto alarde, por meio de um roteiro de 8 perguntas e respostas!
8 perguntas e respostas sobre o DeepSeek
A última semana de janeiro de 2025 foi tomada por uma avalanche de notícias sobre o DeepSeek, não apenas no cenário de tecnologia de ponta e relacionada a inteligência artificial, mas também no segmento financeiro, com quedas importantes no valor de mercado de gigantes, como as “7 Magníficas” (grupo formado por Alphabet, Amazon, Apple, Meta, Microsoft, Nvidia e Tesla).
Muita gente que inclusive não costuma acompanhar o noticiário dos setores, perguntou-se: “Mas afinal o que é DeepSeek e porque está causando esse rebuliço todo?”.
A curiosidade procede, afinal desde que o ChatGPT foi lançado, vários outros LLMs (Large Language Models ou Grandes Modelos de Linguagem) baseados em inteligência artificial têm surgido e apesar de alguns deles atraírem alguns holofotes, nenhum concentrou tanta atenção ou fez tamanho estrago no mercado financeiro.
Para esclarecer tudo o que há por detrás disso, vamos responder às 8 perguntas mais feitas nos últimos dias, sobre essa questão.
1. O que é DeepSeek?
DeepSeek é um modelo de IA (inteligência artificial) generativa, similar ao ChatGPT (Open AI), Gemini (Google), Llama e Meta AI (Meta), desenvolvido pela startup chinesa de mesmo nome, que foi lançado em janeiro de 2025.
Para quem usa o DeepSeek, exceto pela interface própria e alguns detalhes não muito aparentes, parece-se muito com as IAs até então mais conhecidas e que vinham atraindo mais atenção.
Também é baseada em tecnologias como aprendizado de máquina (machine learning) e deep learning, big data, bem como processamento de linguagem natural (PLN) para compreensão das entradas e interações com os usuários.
Vale destacar que o DeepSeek não foi exatamente lançado agora.
Versões anteriores já estavam disponíveis desde 2023, como foi o caso DeepSeek Coder ou o DeepSeek LLM e que pelos testes divulgados na época, já tinha um desempenho comparável ao do GPT-4, mas ainda continha algumas limitações e por isso não impressionou muito.
Outro detalhe importante, é que há duas “variações”, o R1 e o V3.
2. Qual a diferença entre o DeepSeek-R1 e o DeepSeek-V3?
O primeiro – o DeepSeek-R1 – foi idealizado e concebido para se destacar em tarefas que exigem inferência lógica (obtenção de uma conclusão a partir de outras premissas já conhecidas), raciocínio matemático e resolução de problemas em tempo real.
O modelo R1, teve incorporado treinamento do aprendizado em vários estágios e dados de inicialização a frio antes do RL (reforço em larga escala), que o equiparou ao modelo OpenAI-o1-1217 em tarefas de raciocínio.
Já o segundo – o DeepSeek-V3 – é voltado ao processamento escalável de linguagem natural, usando a arquitetura “Mixture-of-Experts”, permitindo lidar com eficiência com uma variedade de aplicações. Essa arquitetura, faz uso da técnica pela qual, diversas redes de especialistas são usadas para dividir um espaço de problema em regiões menores e homogêneas.
Em outras palavras, diferentemente dos modelos mais “famosos”, que tentam saber de tudo, no DeepSeek-V3, são usados apenas os “especialistas” relacionados ao assunto em questão e, portanto, requerendo muito menos parâmetros e poder computacional alocado, aliando boa precisão nas soluções, mas menor tempo que a maioria dos seus concorrentes.
De forma bem resumida e simplista, o R1 é um modelo de IA que “pensa” e resolve problemas e o V3, dá respostas para variadas perguntas.
3. Quem está por trás do DeepSeek?
Como mencionamos, a startup responsável por essa nova IA generativa, é a empresa DeepSeek, sediada em Hangzhou, na China. Foi fundada e financiada pelo fundo de cobertura chinês High-Flyer.
A mente à frente do projeto, é Liang Wenfeng, homem de 40 anos, que nasceu em Guangdong, no sul da China, e se formou na Universidade de Zhejiang em engenharia de informação eletrônica e ciência da computação.
Liang, que também tem formação em finanças e antes de fundar a DeepSeek, foi CEO do fundo High-Flyer, que já utilizava IA para analisar dados financeiros na tomada de decisões de investimento.
4. Como usar o DeepSeek?
É possível ter acesso e usar o DeepSeek por diferentes formas:
-
Desktop / notebook – basta abrir o seu navegador favorito e acessar pela URL “https://chat.deepseek.com/sign_in”, sendo necessário fazer um breve cadastro ou usar uma conta do Google para se logar;
-
Android – baixar e instalar o assistente de AI oficial da DeepSeek gratuitamente na Google Play;
-
iPhone – baixar e instalar o aplicativo para iOS gratuitamente na App Store.
Em ambas as lojas, o app rapidamente ganhou evidência e as avaliações por parte da esmagadora maioria dos usuários, é de 5 estrelas. Os comentários de quem experimentou, frequentemente enaltecem a precisão, o desempenho e a gratuidade, comparado aos assistentes de inteligência artificial concorrentes.
Inclusive, parte do destaque repentino se deve ao chatbot baseado nele ser o aplicativo gratuito mais baixado da App Store nos últimos dias e na loja do Google, já supera mais de 10 milhões de downloads.
5. O DeepSeek é melhor que ChatGTP, Gemini e Meta AI?
Embora testes e benchmarks venham sendo feitos desde que o lançamento ocorreu, não é 100% confiável cravar de modo absoluto qual é o melhor modelo de IA da atualidade.
Em algumas tarefas o desempenho pode ser melhor para um chatbot e em outras, para outro. Há fatores diversos que influenciam o desempenho, como por exemplo, a demanda. Aliás, assim que ganhou destaque, o DeepSeek sofreu um ataque cibernético originário dos EUA, situação na qual é razoável imaginar que seu desempenho seja prejudicado.
De qualquer forma, pelos dados preliminares existentes e em termos gerais, o DeepSeek-R1 saiu-se muito bem comparativamente ao modelo da OpenAI (GPT-4o), que é a principal referência atualmente, mas também em relação ao Qwen2.5 (o modelo da Alibaba), ao Claude-3.5 (Anthropic) e ao Llama 3.1.
6. É seguro usar o DeepSeek?
É tão seguro – ou inseguro – quanto é com qualquer outro chatbot da atualidade.
Deve-se ter em mente que a segurança no ambiente digital, nunca será 100% e que é um aspecto que deve ser tratado tanto do lado do serviço, quanto do usuário. Do lado do serviço, seja o Copilot, seja o Gemini, seja o Meta AI, seja o DeepSeek, todos estão sujeitos a vulnerabilidades, ataques, invasões e vazamentos de dados.
Quanto à privacidade, já que não dá para falar em segurança sem falar em privacidade, é bom lembrar que se trata de um serviço na China e, portanto, sujeito à legislação e políticas locais.
Ao usar o serviço, é preciso concordar com os termos do serviço e política de privacidade, que quase ninguém lê. Entre outras coisas, destaque para:
-
“As informações pessoais que coletamos de você podem ser armazenadas em um servidor localizado fora do país onde você reside. Armazenamos as informações que coletamos em servidores seguros localizados na República Popular da China”;
-
“A DeepSeek tomará as medidas necessárias (não menos que as práticas do setor) para garantir a segurança cibernética e a operação estável dos Serviços”;
-
“Coletamos informações que você fornece ao configurar uma conta, como data de nascimento (quando aplicável), nome de usuário, endereço de e-mail e/ou número de telefone e senha”;
-
“Quando você usa nossos Serviços, podemos coletar sua entrada de texto ou áudio, prompt, arquivos carregados, feedback, histórico de bate-papo ou outro conteúdo que você fornece ao nosso modelo e Serviços”;
-
“Coletamos determinadas informações de dispositivo e conexão de rede quando você acessa o Serviço. Essas informações incluem o modelo do dispositivo, sistema operacional, padrões ou ritmos de teclas, endereço IP e idioma do sistema. Também coletamos informações relacionadas ao serviço, diagnóstico e desempenho, incluindo relatórios de falhas e registros de desempenho. Atribuímos automaticamente a você um ID de dispositivo e um ID de usuário. Quando você faz login em vários dispositivos, usamos informações como o ID do seu dispositivo e o ID do usuário para identificar sua atividade em vários dispositivos, proporcionando uma experiência de login perfeita e para fins de segurança.”;
Há vários outros parágrafos que estabelecem que informações são colhidas e armazenadas e até por quanto tempo (indeterminado).
Entre muitas coisas, a DeepSeek mantém logs, endereços de IP, informações dos dispositivos e do sistema operacional usados, endereço de e-mail e até as informações que você fornece via prompt de comando.
Ou seja, praticamente tudo que você fornecer de informações suas ou for possível coletar, pode ser armazenado e usado para diversos fins e por tempo indeterminado.
Portanto, é importante usar o serviço com cautela e bom senso!
7. Por que o DeepSeek ganhou tanto destaque?
Pelo que revelamos até aqui, a maioria deve estar se perguntando por qual razão esse modelo de IA tem recebido tanta atenção, certo?
A questão reside principalmente no fato de que o DeepSeek vem apresentando resultados razoavelmente equivalentes aos modelos mais conhecidos, porém com um investimento significativamente menor.
Os valores divulgados ou estimados pela Open AI e Microsoft, para o ChatGPT e Copilot, pelo Google e o Gemini, bem como pela Meta no caso do Llama 3.1 e Meta AI, estão na casa dos 10 dígitos. Só a Microsoft planeja injetar mais de 10 bilhões de dólares na parceria com a Open AI.
No caso do DeepSeek, o treinamento custou “apenas” US$ 5,58 milhões, segundo os chineses.
Embora pareça muito, representa uma fração mínima do investimento que vem sendo feito pelas big techs, para dispor de um resultado final equivalente ou muito próximo!
Soma-se a isso, o fato de que parece que a infraestrutura necessária, é bem menos sofisticada. Apesar de não haver muita transparência nessa área, estima-se que a Meta tenha feito uso de mais de 16.000 GPUs H100 da Nvidia, para treinamento na Llama 3.1, enquanto que a DeepSeek revela que usou 2 mil chips H800 da Nvidia para treinar o modelo R1.
Por essa razão, os investidores questionaram o grau de eficiência dos players norte-americanos.
Não fosse suficiente, o modelo da DeepSeek faz uso de processadores usados para games, não dependendo dos chips mais caros e poderosos que os demais usam, o que fez com que a Nvidia perdesse o posto de empresa mais valiosa do mundo, ao ter seu valor de mercado cair US$ 589 bilhões em apenas um dia.
A fabricante de chips de IA encerrou a sessão em forte queda de 17%. Outras empresas norte-americanas do setor, também tiveram quedas expressivas, mas aos poucos se recuperaram.
Em outras palavras, a DeepSeek, além das também chinesas Alibaba e ByteDance, que também já contam com seus modelos de IA, estão desafiando a liderança das empresas norte-americanas na corrida da inteligência artificial.
8. Por que é bom o Deep Seek ser open source?
Outro ponto ainda não mencionado, é o fato do DeepSeek além de ser grátis, também é open source, contrariando aos modelos completos e mais sofisticados dos principais players.
Ao fazer uso de código aberto, significa que outros desenvolvedores interessados, podem ter acesso à programação do DeepSeek e poderão desenvolver suas próprias aplicações, usar em outros produtos e adaptar esse código às suas necessidades, além de ser possível introduzir melhorias e correções de bugs, tornando o seu desenvolvimento mais rápido, democrático, transparente e econômico.
É verdade que a OpenAI adota open source no GPT-2 e GPT-3 e a Meta também, no caso do Llama 3.1, porém é algo surpreendente para uma empresa chinesa.
Conclusão
O lançamento da versão mais recente do modelo de IA generativa DeepSeek, redefiniu algumas crenças e o futuro da corrida na área de inteligência artificial.