/

27.07.2025

Alibaba Qwen представляет Qwen3-MT: новое поколение машинного перевода с поддержкой множества языков

Qwen API
Alibaba представила Qwen3-MT (qwen-mt-turbo) через Qwen API — свою новейшую и наиболее продвинутую модель машинного перевода, созданную для преодоления языковых барьеров с беспрецедентной точностью, скоростью и гибкостью. Обученная на триллионах многоязычных токенов, Qwen3-MT поддерживает более 92 языков, охватывая свыше 95% мирового населения. Благодаря передовой архитектуре, обучению с подкреплением и богатым возможностям настройки, она обеспечивает высочайшее качество перевода при значительно меньших затратах и задержках по сравнению с традиционными системами.

Архитектура модели и данные обучения

Qwen3-MT построена на сложной трансформерной архитектуре Qwen3 от Alibaba, усиленной облегченной структурой Mixture-of-Experts (MoE). Этот дизайн сочетает вычислительную эффективность с глубоким контекстным пониманием для оптимизации качества перевода.
  • Масштаб: Обучена на триллионах токенов, охватывающих разнообразные языки, домены и стили — от формальных юридических текстов до разговорной речи и технической литературы.
  • Многоязычность: Обширный набор данных обеспечивает тонкое понимание синтаксиса, семантики, идиом и культурного контекста для различных языковых пар.
  • Обучение с подкреплением: Постоянная донастройка с помощью обучения с подкреплением позволяет модели динамически адаптироваться для повышения беглости, точности и идиоматичности на основе реальных отзывов.
OpenReasoning-Nemotron — иллюстрация
Оценка качества перевода — автоматические метрики

Поддержка языков и охват аудитории

Поддерживая 92+ языка, Qwen3-MT охватывает огромную глобальную аудиторию, включая следующие языковые семьи:
Языковая семья Примеры языков
Индоевропейская Английский, французский, испанский, русский, хинди, бенгальский, немецкий
Китайско-тибетская Китайский (упрощенный, традиционный, кантонский), бирманский
Афразийская Арабский (с диалектами), иврит, мальтийский
Австронезийская Индонезийский, малайский, тагальский
Дравидийская Тамильский, телугу, каннада
Тюркская Турецкий, казахский, узбекский
Другие Японский, корейский, тайский, вьетнамский, суахили, баскский
Эти поддерживаемые языки в совокупности охватывают более 95% мирового населения, позволяя компаниям и разработчикам создавать по-настоящему глобальные многоязычные решения.

Производительность и оценка качества

Автоматические метрики

Qwen3-MT демонстрирует лидирующие показатели BLEU на известных тестовых наборах, таких как:
  • Китайско-английские и англо-немецкие тесты, превосходя модели вроде GPT-4.1-mini и Gemini-2.5-Flash.
  • Многоязычный бенчмарк WMT24, показывая сопоставимое качество перевода с крупными моделями, такими как GPT-4.1 и Gemini-2.5-Pro, но при значительно меньших вычислительных затратах.
Архитектура MoE обеспечивает эту эффективность, активируя только специализированные подмножества модели для каждого запроса, что сокращает время и стоимость обработки.

Оценка людьми

Тройные слепые оценки профессиональных переводчиков для десяти основных языков (например, английского, китайского, японского, арабского, испанского) показали, что Qwen3-MT лидирует по:
  • Частоте принятия: Большему количеству переводов, одобренных профессионалами.
  • Частоте отличных оценок: Больше переводов получили оценку «отлично» за беглость, семантическую точность и контекстуальную достоверность.
Эти метрики подтверждают качество перевода в реальных условиях, выходящее за рамки автоматических оценок.

Производительность, масштабируемость и экономическая эффективность

  • Сверхбыстрый вывод: Благодаря MoE и оптимизированной маршрутизации Qwen3-MT обеспечивает низкую задержку, что поддерживает приложения в реальном времени, такие как живой чат и потоковый перевод.
  • Высокая параллельная обработка: Может эффективно обслуживать тысячи одновременных запросов, что подходит для крупных SaaS-платформ, электронной коммерции и медиа.
  • Экономичная цена: Начиная с $0.5 за миллион токенов, модель значительно снижает затраты по сравнению с плотными, полностью активированными большими моделями.
Визуальные сравнения показывают, что Qwen3-MT сохраняет лидирующие позиции в балансе скорости, стоимости и качества перевода.

Настройка и адаптация к доменам

Qwen3-MT предлагает расширенные возможности для специализированной настройки:
  • Контроль терминологии: Пользователи могут обеспечивать единообразие перевода брендов, технических терминов или жаргона через прямое внедрение глоссария.
  • Доменные подсказки: Кастомизация стиля и тона перевода — юридический, медицинский, разговорный или технический — улучшает контекстуальную уместность.
  • Интеграция памяти переводов: Адаптивное повторное использование пользовательских правок и прошлых переводов ускоряет рабочие процессы и повышает согласованность, особенно в крупных проектах.
Такая гибкость делает Qwen3-MT идеальным решением для предприятий со специализированными языковыми требованиями.

Обучение с подкреплением: повышение беглости перевода

Постоянно учитывая обратную связь после редактирования и данные пользовательских взаимодействий, конвейер обучения с подкреплением Qwen3-MT постепенно улучшает:
  • Сохранение контекста и идиоматическую точность для разных языков.
  • Сокращение критических ошибок с учетом сложности домена.
  • Адаптацию к меняющимся языковым трендам и предпочтениям пользователей в реальном времени.
Такой подход к непрерывному обучению гарантирует актуальность и точность переводов с течением времени.

Доступ к API и развертывание

  • Qwen API: Предоставляет RESTful-эндпоинты и SDK для легкой интеграции в веб-, мобильные и серверные системы.
  • Гибкое развертывание: Поддерживает облачные, периферийные и гибридные архитектуры, а также пакетный режим перевода для обработки больших объемов.
  • Высокая надежность: Разработана для корпоративных SLA с надежным мониторингом и гарантиями доступности.

Сценарии применения

Qwen3-MT используется в:
  • Локализации электронной коммерции: Перевод описаний товаров, отзывов и запросов клиентов в реальном времени.
  • Управлении контентом: Автоматизированная локализация новостей, документации и образовательных материалов.
  • Обслуживании клиентов: Многоязычная автоматизация обработки заявок, чат-ботов и виртуальных ассистентов, улучшающая клиентский опыт по всему миру.

Конкурентные преимущества

Функция Qwen3-MT Google Translate Azure Translator AWS Translate
Поддерживаемые языки 92+ 100+ 90+ 75+
Контекстное понимание Высокое Среднее Среднее Среднее
Обучение с подкреплением Да Ограничено Нет Нет
Пакетная обработка Да Да Да Да
Режим реального времени Да Да Да Да
Кастомные модели Да Да Да Да
Стартовая цена $0.5/млн токенов Плата за использование Плата за использование Плата за использование
Сочетание качества перевода, экономической эффективности и расширяемости делает Qwen3-MT одним из лучших решений для машинного перевода на сегодняшний день.

Заключение

Qwen3-MT от Alibaba представляет собой значительный прорыв в технологии машинного перевода, предлагая широкую языковую поддержку, превосходное качество перевода, подтвержденное как автоматическими, так и человеческими оценками, а также готовую для предприятий скорость и экономическую эффективность. Ее инновационная архитектура Mixture-of-Experts в сочетании с обучением с подкреплением гарантирует, что Qwen3-MT остается адаптируемой, масштабируемой и ориентированной на будущее — позволяя разработчикам и бизнесам беспрепятственно общаться на разных языках в глобальном масштабе.
Ознакомьтесь с демо на Hugging Face, демо на ModelScope, документацией API и техническими деталями
Picture of Полина Сергеева

Полина Сергеева

AI-разработчик и технический писатель. Создаёт инструменты на базе нейросетей и делится практическими гайдами для разработчиков и бизнеса.

Email автора