Китайський технологічний гігант Alibaba у вівторок представив Qwen3, нове покоління свого сімейства великих мовних моделей (LLM) з відкритим кодом, уперше реалізувавши гібридну систему мислення в своїх моделях, пише Сіньхуа.
Серія Qwen3 включає шість щільних моделей і дві моделі типу Mixture-of-Experts (MoE), що забезпечують гнучкість для створення наступного покоління застосунків — від мобільних пристроїв і смарт-окулярів до автономних авто, робототехніки та інших сфер.
Усі моделі мають відкритий код і вже доступні по всьому світу.
За словами Alibaba, Qwen3 може перемикатися між “режимом мислення” — для складних багатокрокових завдань, таких як математика, програмування чи логічні висновки — і “немислячим режимом”, який забезпечує швидкі, універсальні відповіді для загальних потреб.
З моменту першого випуску, модельна лінійка Qwen була завантажена понад 300 мільйонів разів у всьому світі.
У Китаї зростає попит на LLM-моделі. Зокрема, активно розвиваються проєкти DeepSeek, ERNIE від Baidu та Doubao від ByteDance. Дані свідчать, що до 2024 року в Китаї було зареєстровано і запущено майже 200 генеративних AI-моделей, а кількість зареєстрованих користувачів перевищила 600 мільйонів.
Висновки та перспективи
Запуск Qwen3 знаменує собою важливий прорив у світовій гонці штучного інтелекту. Гібридна архітектура, яка поєднує швидкі відповіді з глибоким аналітичним мисленням, відкриває шлях до нової ери застосунків, які зможуть краще адаптуватися до реального світу — від освітніх платформ до складної автономної навігації.
Відкритий код означає, що глобальна спільнота може швидко інтегрувати ці моделі, удосконалювати їх і розвивати нові продукти. Це також посилює позиції Китаю як одного з технологічних лідерів у сфері генеративного ШІ.
Для світу це означає зростання конкуренції з боку китайських компаній, а також можливість побачити більше інновацій, створених не лише у США, але й в Азії. Інтеграція гібридного мислення у ШІ може змінити підхід до розробки рішень у сфері охорони здоров’я, фінансів, освіти та оборони.
У глобальному контексті такі моделі, як Qwen3, можуть стати інструментами геополітичного впливу, оскільки країни все більше покладаються на локальні або дружні AI-платформи. Це може сформувати нову карту впливу у цифрову епоху, де програмні алгоритми стають стратегічними активами.