Os chineses estão atualizando o DeepSeek. Lançar um novo não é tão fácil.

Conforme relatado pela Bloomberg, de acordo com uma publicação do DeepSeek no grupo oficial do WeChat, a versão V3.1 tem uma janela de contexto mais longa, o que significa que pode incluir mais informações para qualquer consulta. Isso poderia, por exemplo, permitir conversas mais longas com melhor memorização . A startup sediada em Hangzhou não forneceu muitos detalhes sobre a atualização e não divulgou a documentação nas principais plataformas, incluindo o Hugging Face.
A velocidade e a popularidade dos modelos DeepSeek desafiaram líderes americanos como a OpenAI e mostraram como empresas chinesas podem fazer avanços em IA por uma fração do custo.
O R1, que superou vários concorrentes ocidentais em métricas padrão, surpreendeu o mundo quando foi revelado no início deste ano .
Quando o DeepSeek R2 estreará? Ainda não sabemos a data.Os fãs do DeepSeek ainda estão esperando o lançamento do R2, o sucessor do R1, com a mídia local culpando o perfeccionismo e os erros do CEO Liang Wenfeng pelo atraso.
De acordo com a Reuters, os engenheiros da DeepSeek têm trabalhado para melhorar o R2 nos últimos meses até que Liang dê sinal verde para o lançamento.
No entanto, uma implementação rápida do R2 pode ser difícil devido à escassez de processadores de servidor Nvidia na China devido às regulamentações de exportação dos EUA.
Os chineses precisam de circuitos integrados americanosO potencial aumento na demanda pelo R2 sobrecarregaria os provedores de nuvem chineses , que precisam de chips Nvidia avançados para executar modelos de IA.
A DeepSeek contatou diversas empresas chinesas de nuvem com especificações técnicas para ajudá-las a planejar como hospedar e distribuir o modelo a partir de seus servidores. Dos atuais clientes R1 da empresa, a maioria o utiliza com chips H20 da Nvidia .
Novas restrições à exportação, introduzidas pelo governo Trump em abril, impediram a Nvidia de vender chips H20 — os únicos processadores de IA que a empresa podia exportar legalmente para a China na época — no mercado chinês. No entanto, em agosto, o presidente dos EUA reverteu sua decisão , concordando em exportar chips de IA "obsoletos" da NVIDIA e da AMD para a China em troca de uma contribuição de 15% das vendas para o Tesouro dos EUA.
wnp.pl