Популярные криптовалюты

ETH $2,420.57 -2.37%
BTC $103,546.19 +0.04%
SOL $140.68 -0.46%
XRP $2.1135 -0.26%
PEPE $0.0000097 -1.32%
UNI $6.884 -6.97%
DOGE $0.16068 -0.84%

Alibaba представил «гибридные» ИИ-модели Qwen3

WEN $0.0000317 -0.01%

Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.

Китайский техгигант Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.

Introducing Qwen3! We release and open-weight Qwen3, our latest large language models, including 2 MoE models and 6 dense models, ranging from 0.6B to 235B. Our flagship model, Qwen3-235B-A22B, achieves competitive results in benchmark evaluations of coding, math, general… pic.twitter.com/JWZkJeHWhC

— Qwen (@Alibaba_Qwen) April 28, 2025

Их размер варьируется от 600 млн до 235 млрд параметров. Модели являются «гибридными» — они способны как затрачивать больше времени для рассуждений, так и предоставлять быстрые ответы. 

«Мы органично объединили режимы мышления и немышления, предоставив пользователям гибкость […]. Такая конструкция позволяет с большей легкостью настраивать бюджеты для конкретных задач», — отметила команда в блоге. 

Qwen3 поддерживает 119 языков и обучена на наборе данных, содержащем более 36 трлн токенов. 

На платформе по оценке навыков программирования Qwen-3-235B-A22B обошла o3-mini и Gemini 2.5 Pro. o3-mini она опередила в последней версии математического теста AIME и BFCL — оценивает способность «рассуждать» о проблемах.

Qwen-3-235B-A22B пока нет в публичном доступе. Qwen3-32B является крупнейшей среди открытых. Она превосходит o1 в нескольких тестах, включая бенчмарк программирования LiveCodeBench.

Напомним, в марте Alibaba представила ориентированную на рассуждения ИИ-модель QwQ-32.

RSS 29.04.2025 1 152
Источник: https://forklog.com/news/ai/alibaba-predstavil-gibridnye-ii-modeli-qwen3