O modelo Qwen-3-Max-Preview tem mais de um trilhão de parâmetros. Foto: Reuters . |
O Alibaba Group Holding acaba de lançar seu maior modelo de inteligência artificial até o momento, marcando um novo passo na corrida global pela IA. Chamado Qwen-3-Max-Preview, este é o primeiro modelo do grupo de tecnologia chinês a ultrapassar a marca de um trilhão de parâmetros, colocando o Alibaba no mesmo patamar de "gigantes" como OpenAI, Google DeepMind ou Anthropic.
O novo modelo, lançado em 5 de setembro, já está disponível no Alibaba Cloud e no principal marketplace de modelos de linguagem, o OpenRouter. O Qwen-3-Max-Preview dá continuidade à série Qwen3, lançada em maio, com versões que variam de 600 milhões a 235 bilhões de parâmetros.
Em IA, os parâmetros são considerados a "inteligência" de um sistema, as variáveis que são ajustadas durante o treinamento. Um número maior de parâmetros normalmente significa recursos mais poderosos, mas também requer um poder de computação enorme. Para efeito de comparação, estima-se que o GPT-4.5 da OpenAI, um dos maiores modelos disponíveis atualmente, tenha de 5 a 7 trilhões de parâmetros.
De acordo com o anúncio, o Qwen-3-Max-Preview é um modelo de processamento de texto com desempenho superior ao Qwen3-235B-A22B-2507. Em testes internos, o Qwen-3-Max-Preview superou o Kimi K2 da MoonShot AI, uma versão sem inferência do Claude Opus 4, e o DeepSeek V3.1, que suporta o formato da Anthropic. No entanto, esses benchmarks não foram incluídos no relatório técnico oficial.
“O Qwen-3-Max-Preview apresenta melhorias significativas em suas capacidades gerais, desde a compreensão de textos em chinês e inglês, passando pela execução de instruções complexas, até a execução de tarefas subjetivas, o suporte a vários idiomas e o uso de ferramentas. A expansão ainda está em andamento, e o lançamento oficial trará mais surpresas”, afirmou o Alibaba em um comunicado.
Ao longo dos anos, o Qwen ajudou o Alibaba a se destacar no ecossistema global de IA de código aberto. Esses modelos alcançaram mais de 20 milhões de downloads e geraram 100.000 modelos derivados na plataforma Hugging Face. No entanto, o Qwen-3-Max-Preview não é de código aberto. Os usuários só podem acessá-lo via Alibaba Cloud ou OpenRouter, semelhante ao Qwen2.5-Max.
Nas redes sociais, Binyuan Hui, engenheiro de IA da Alibaba, revelou que uma versão “racional” do modelo ainda está em desenvolvimento.
O custo de acesso ao Qwen-3-Max-Preview no Alibaba Cloud também está entre os mais altos da família Qwen. O preço inicial é de US$ 0,861 por milhão de tokens de entrada e US$ 3,441 por milhão de tokens de saída. Já a versão Qwen3-235B-A22B-2507 custa apenas US$ 0,287 por milhão de tokens de entrada e US$ 1,147 por milhão de tokens de saída.
Fonte: https://znews.vn/alibaba-cong-bo-mo-hinh-thach-thuc-openai-post1583459.html
Comentário (0)