Ce nouveau modèle remet non seulement en cause la domination des géants américains, mais remodèle également l’ensemble du jeu avec l’open source (Illustration : DS).
Le modèle comporte 685 milliards de paramètres et est publié sous licence open source. Les premiers résultats des tests montrent que ses performances sont comparables à celles des systèmes propriétaires d'OpenAI ou d'Anthropic, et ouvrent une nouvelle approche pour le développement et la distribution de modèles d'IA avancés.
Performances et coût
Peu après sa sortie sur la plateforme Hugging Face, DeepSeek V3.1 a obtenu un score de 71,6 % au test de programmation Aider. Techniquement, le modèle est capable de gérer des contextes allant jusqu'à 128 000 jetons (l'équivalent d'un livre d'environ 400 pages). L'architecture est qualifiée d'« hybride », intégrant des fonctions de conversation, de raisonnement et de programmation.
« DeepSeek V3.1 a atteint 71,6 % sur Aider, soit environ 1 % de plus que Claude Opus 4 tout en coûtant nettement moins cher », a déclaré le chercheur en IA Andrew Christianson sur le réseau social X.
On estime que le coût moyen pour réaliser une tâche de programmation à l’aide de la version V3.1 est d’environ 1,01 $, tandis que les systèmes équivalents peuvent coûter plus près de 70 $.
Certains développeurs communautaires ont également noté la présence de quatre « jetons spéciaux » dans l’architecture, qui permettent au modèle d’intégrer la recherche Web en temps réel et de gérer des processus d’inférence complexes.
Cette différence se traduit par des millions de dollars d’économies pour les entreprises qui gèrent des milliers d’interactions avec l’IA chaque jour.
Un avantage qui change la donne
La version 3.1 intervient quelques semaines seulement après l'annonce de nouveaux modèles par OpenAI et Anthropic. En optant pour une approche open source, DeepSeek adopte une stratégie différente de celle de nombreuses entreprises américaines qui commercialisent des modèles d'IA via des API payantes.
Certains affirment que rendre les capacités avancées largement disponibles pourrait permettre aux organisations et aux entreprises de se déployer plus rapidement, tout en remettant en question les modèles commerciaux basés sur les monopoles technologiques.
L’émergence de DeepSeek V3.1 montre que l’IA avancée n’est pas seulement le domaine des grandes entreprises, mais aussi des petits groupes de recherche.
La concurrence dans ce domaine ne se limite plus à la construction du système le plus puissant, mais vise également à rendre la technologie accessible et abordable.
Dans ce contexte, la question pour les entreprises technologiques est de savoir comment maintenir leur valeur commerciale alors que de plus en plus de modèles open source apparaissent avec des performances et des coûts compétitifs.
Source : https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm
Comment (0)