OpenAI dice que ha lanzado dos modelos de lenguaje de peso abierto que se destacan en la inferencia avanzada y están optimizados para ejecutarse en computadoras portátiles con niveles de rendimiento similares a sus modelos de inferencia propietarios 4o-mini.
Los parámetros o pesos entrenados de un modelo de lenguaje ponderado abierto son de acceso público y los desarrolladores los utilizan para analizar y ajustar el modelo para tareas específicas sin necesidad de los datos de entrenamiento originales.
“Una de las características únicas de los modelos abiertos es que se pueden ejecutar localmente. Se pueden ejecutar tras sus propios cortafuegos, en su propia infraestructura”, declaró Greg Brockman, cofundador de OpenAI, en un comunicado de prensa.

Las versiones 120B y 20B de gpt-oss pueden ejecutarse de forma nativa en computadoras portátiles.
Los modelos de lenguaje de peso abierto se diferencian de los modelos de código abierto en que brindan acceso a todo el código fuente, los datos de entrenamiento y la metodología.
Por otra parte, Amazon anunció que los modelos de peso abierto de OpenAI ya están disponibles en la plataforma de IA Generativa Bedrock de Amazon Web Services. Esta es la primera vez que un modelo de OpenAI está disponible en Bedrock, según Atul Deo, gerente de producto de Bedrock.
“OpenAI ha estado desarrollando excelentes modelos, y creemos que estos modelos serán excelentes opciones de código abierto o de modelado abierto para los clientes”, declaró Deo en una entrevista. Se negó a comentar sobre cualquier acuerdo contractual entre AWS y OpenAI.
La semana pasada, Amazon informó que la compañía había desacelerado el crecimiento de su unidad AWS, especialmente en comparación con sus competidores.

El modelo gpt-oss-20b se vende en la plataforma de comercio electrónico Sage Maker.
El panorama de los modelos de IA de código abierto y las ponderaciones abiertas ha sido polémico este año. Durante un tiempo, los modelos Llama de META se consideraron los mejores, pero esto cambió a principios de este año cuando DeepSeek de China lanzó un modelo de razonamiento potente y rentable, mientras que Meta tenía dificultades para desarrollar Llama 4.
Los dos nuevos modelos OpenAI son los primeros modelos abiertos que OpenAI ha lanzado desde GPT-2, que se lanzó en 2019.
El modelo más grande de OpenAI, gpt-oss-120b, puede ejecutarse en una sola GPU, y el segundo modelo, gpt-oss-20b, es lo suficientemente pequeño como para ejecutarse directamente en una computadora personal, dijo la compañía.
OpenAI dice que estos modelos funcionan de manera similar a sus modelos de inferencia propietarios llamados o3-mini y o4-mini, y se destacan particularmente en programación, matemáticas competitivas y consultas relacionadas con la salud.
Los modelos se entrenan con un conjunto de datos de solo texto que se centra en ciencias , matemáticas y programación, además de conocimientos generales. OpenAI no publica comparativas que comparen sus modelos de peso abierto con modelos de la competencia, como DeepSeek-R1.
OpenAI, respaldada por Microsoft, actualmente valorada en 300 mil millones de dólares, ahora está recaudando hasta 40 mil millones de dólares en una nueva ronda de financiación liderada por Softbank Group.
Fuente: https://khoahocdoisong.vn/openai-phat-hanh-phien-ban-open-weight-co-the-chay-tren-laptop-post2149044060.html
Kommentar (0)