Китайский технологический гигант Alibaba анонсировал семейство моделей искусственного интеллекта Qwen3, которые, по заявлению компании, соперничают, а в некоторых аспектах превосходят ведущие решения от OpenAI и Google .

Модели Qwen3 разработаны с использованием гибридной архитектуры, сочетающей режимы "мышления" и "не-мышления". Это позволяет моделям эффективно справляться как с простыми, так и с сложными задачами, оптимизируя использование вычислительных ресурсов. Некоторые версии Qwen3 также используют архитектуру смешанных экспертов (MoE), делегируя подзадачи специализированным подмоделям для повышения эффективности.
Семейство Qwen3 включает модели от 0,6 до 235 миллиардов параметров. Самая крупная модель, Qwen3-235B-A22B, показала высокие результаты в тестах Codeforces и AIME, опережая модели o3-mini от OpenAI и Gemini 2.5 Pro от Google. Однако эта модель пока не доступна публично. Наиболее мощная общедоступная версия, Qwen3-32B, демонстрирует конкурентоспособность с рядом фирменных и открытых моделей ИИ, включая R1 от DeepSeek и o1 от OpenAI.
Модели Qwen3 обучены на массивном наборе данных объемом около 36 триллионов токенов, включающем учебные материалы, пары вопросов и ответов, фрагменты кода и данные, сгенерированные ИИ. Они поддерживают 119 языков, что расширяет их применимость в глобальном контексте.
Alibaba делает большинство моделей Qwen3 доступными для загрузки по открытой лицензии через платформы Hugging Face и GitHub. Кроме того, они доступны у облачных провайдеров, таких как Fireworks AI и Hyperbolic.
С выходом Qwen3 Alibaba укрепляет свои позиции в области искусственного интеллекта, предлагая мощные и доступные инструменты для разработчиков и исследователей по всему миру.