Este nuevo modelo no sólo desafía el dominio de los gigantes estadounidenses, sino que también reestructura todo el juego con código abierto (Ilustración: DS).
El modelo cuenta con 685 mil millones de parámetros y se publica bajo una licencia de código abierto. Los resultados iniciales de las pruebas muestran que su rendimiento es comparable al de los sistemas propietarios de OpenAI o Anthropic, y abre un nuevo enfoque para el desarrollo y la distribución de modelos avanzados de IA.
Rendimiento y coste
Poco después de su lanzamiento en la plataforma Hugging Face, DeepSeek V3.1 obtuvo una puntuación del 71,6 % en la prueba de programación de Aider. Técnicamente, el modelo es capaz de gestionar contextos de hasta 128 000 tokens (el equivalente a un libro de unas 400 páginas). La arquitectura se describe como «híbrida» e integra funciones de conversación, razonamiento y programación.
“DeepSeek V3.1 alcanzó el 71,6% en Aider, aproximadamente un 1% más que Claude Opus 4 y con un coste significativamente menor”, dijo el investigador de inteligencia artificial Andrew Christianson en la red social X.
Se estima que el costo promedio para completar una tarea de programación utilizando V3.1 es de alrededor de $1,01, mientras que sistemas equivalentes pueden costar cerca de $70.
Algunos desarrolladores de la comunidad también notaron la presencia de cuatro “tokens especiales” en la arquitectura, que permiten al modelo integrar la búsqueda web en tiempo real y manejar procesos de inferencia complejos.
Esta diferencia se traduce en millones de dólares en ahorros para las empresas que gestionan miles de interacciones de IA cada día.
Ventaja que cambia el juego
El lanzamiento de la versión 3.1 llega apenas unas semanas después de que OpenAI y Anthropic anunciaran nuevos modelos. Al optar por un enfoque de código abierto, DeepSeek sigue una estrategia diferente a la de muchas empresas estadounidenses que comercializan modelos de IA mediante API de pago.
Algunos sostienen que hacer que las capacidades avanzadas estén ampliamente disponibles podría permitir a las organizaciones y empresas implementarlas más rápidamente, y al mismo tiempo desafiar los modelos de negocios basados en monopolios tecnológicos.
La aparición de DeepSeek V3.1 muestra que la IA avanzada no es sólo dominio de las grandes corporaciones, sino también de grupos de investigación más pequeños.
La competencia en este espacio ya no se limita a construir el sistema más potente, sino que también gira en torno a hacer que la tecnología sea accesible y asequible.
En ese contexto, la pregunta para las empresas de tecnología es cómo mantener el valor comercial cuando aparecen cada vez más modelos de código abierto con rendimiento y costos competitivos.
Fuente: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm
Kommentar (0)