GPU-дефицит: главное ограничение
Санкции на экспорт высокопроизводительных GPU (NVIDIA A100, H100) в Россию — ключевой фактор, определяющий ландшафт ML-платформ в стране. Введённые осенью 2022 года и ужесточённые в октябре 2023 года, эти ограничения создали критический дефицит вычислительных ресурсов для обучения крупных моделей.
Последствия ощущаются на всех уровнях:
- Обучение LLM — разработка собственных крупных языковых моделей (YandexGPT, GigaChat) ограничена доступными GPU. Компании используют кластеры, закупленные до санкций, и ищут пути обхода (параллельный импорт, китайские аналоги)
- Облачные GPU — дефицит GPU-инстансов в российских облаках. Очереди на GPU в Yandex Cloud и Cloud.ru измеряются неделями
- Стоимость — цены на GPU-вычисления в России на 30–50% выше мировых из-за ограниченного предложения
- Инференс — для запуска обученных моделей требуется меньше ресурсов, но дефицит сказывается и здесь, особенно для высоконагруженных сервисов
Альтернативы NVIDIA — китайские Huawei Ascend и Biren BR100 — пока не получили широкого распространения в России. Экосистема (драйверы, CUDA-совместимость, библиотеки) значительно уступает NVIDIA, что делает миграцию на эти платформы затратной и рискованной.
Yandex DataSphere: лидер российских ML-платформ
Yandex DataSphere — облачная ML-платформа на базе Yandex Cloud — к началу 2025 года является наиболее функциональным российским решением для работы с данными и машинным обучением.
Ключевые возможности, запущенные или обновлённые к Q1 2025:
- Jupyter-среда с автоматическим масштабированием вычислительных ресурсов — от CPU до GPU по требованию
- Управление данными — интеграция с S3, ClickHouse, Managed PostgreSQL. Data versioning для воспроизводимости экспериментов
- ML Pipeline — визуальный конструктор пайплайнов обработки данных и обучения моделей
- Model Registry — хранилище обученных моделей с версионированием и метаданными
- Deploy — выкатка моделей в production через API endpoint с автомасштабированием
DataSphere позиционируется как «Vertex AI для России» — единая платформа от данных до продакшена. По функциональности она уступает Google Vertex AI и AWS SageMaker, но для российского рынка это наиболее зрелое предложение.
Основной конкурент — Cloud.ru ML Space, ориентированный на enterprise-заказчиков (банки, телеком, промышленность). ML Space сильнее в аспекте безопасности и сертификации, но уступает DataSphere по UX и разнообразию сервисов.
Open-source модели: Llama 2, Mixtral и альтернативы
На фоне ограниченного доступа к проприетарным AI-сервисам (GPT-4, Claude) open-source модели становятся критически важными для российского рынка. К началу 2025 года ландшафт open-source LLM выглядит так:
- Llama 2 (Meta) — 7B, 13B, 70B параметров. Наиболее популярная open-source модель. Лицензия позволяет коммерческое использование
- Mixtral 8x7B (Mistral AI) — MoE-архитектура, сопоставимая по качеству с GPT-3.5. Эффективнее по ресурсам, чем модели аналогичного качества
- Saiga/GigaSaiga — русскоязычные дообучения Llama и Mistral. Качество на русском языке выше, чем у оригинальных моделей, но уступает YandexGPT
- CodeLlama — специализированная модель для генерации кода. Основа для потенциальных российских coding-ассистентов
Open-source модели позволяют российским компаниям развёртывать AI-решения on-premise, не зависеть от облачных API и соблюдать требования к обработке данных. Основное ограничение — вычислительные ресурсы: запуск Llama 2 70B требует нескольких GPU A100/H100, которые в дефиците.
Практический компромисс — использование моделей меньшего размера (7B–13B) с дообучением под конкретные задачи. Для многих бизнес-задач (классификация текстов, извлечение сущностей, суммаризация) модели этого масштаба показывают адекватное качество при разумных вычислительных затратах.
MLOps: стадия ноль для большинства
MLOps (Machine Learning Operations) — практика автоматизации жизненного цикла ML-моделей: от обучения до мониторинга в продакшене. В зрелых организациях MLOps включает автоматическое переобучение, A/B-тестирование моделей, мониторинг data drift и версионирование.
Реальность большинства российских компаний далека от этого идеала:
| Стадия MLOps | Описание | Доля компаний |
|---|---|---|
| Стадия 0 | Ручные эксперименты в Jupyter, нет CI/CD для моделей | ~60% |
| Стадия 1 | Автоматизация обучения, базовый pipeline | ~25% |
| Стадия 2 | CI/CD для моделей, мониторинг, A/B-тесты | ~10% |
| Стадия 3 | Полная автоматизация, автопереобучение, feature store | ~5% |
Основные причины низкой зрелости MLOps:
- Кадры — ML-инженеры с опытом production ML и инфраструктуры — одна из самых дефицитных специализаций
- Инструменты — MLflow, Kubeflow, DVC существуют, но требуют значительных усилий по настройке и поддержке
- Масштаб — у большинства компаний 1–3 ML-модели в production, что не оправдывает инвестиции в полноценную MLOps-платформу
- Приоритеты — бизнес чаще хочет «быстро запустить модель», чем «правильно построить процесс»
ML-платформы для enterprise
Крупные российские организации (банки, телеком, ритейл) — основные потребители ML-платформ. Их требования отличаются от стартапов:
- Безопасность — данные не покидают периметр, сертификация ФСТЭК, аудируемость
- Масштаб — десятки и сотни ML-моделей в production (рекомендации, антифрод, ценообразование)
- Интеграция — с существующей инфраструктурой (Hadoop, Spark, Kafka, internal data lakes)
- Поддержка — SLA, гарантированное время реакции, русскоязычная документация
Для этого сегмента основные варианты — Cloud.ru ML Space (для облачного развёртывания), DataSphere (Yandex Cloud), а также on-premise решения на базе open-source стека (Kubeflow + MLflow + Apache Airflow). Сбер, Яндекс и крупные банки строят собственные ML-платформы, которые не продаются на рынке, но задают стандарт для отрасли.
Прогноз: ML-платформы в 2025 году
Ключевые тенденции ML-платформ в 2025 году:
- GPU-as-a-Service — облачные провайдеры будут наращивать парк GPU (в том числе через нестандартные каналы поставки). Доступность облачных GPU — главный фактор для развития ML в России
- Рост open-source LLM — Llama 3 (ожидается в 2025), Mixtral 8x22B и их наследники станут ещё качественнее. Self-hosted развёртывание — реалистичный путь для российских компаний
- MLOps взросление — доля компаний на стадии 1–2 MLOps вырастет с 35% до 45–50%. Облачные платформы (DataSphere, ML Space) упрощают вход в MLOps
- Fine-tuning как основной подход — вместо обучения моделей с нуля компании будут дообучать open-source модели на своих данных. Это требует на порядок меньше GPU-ресурсов
Если вы строите ML-команду или ML-инфраструктуру — фокусируйтесь на воспроизводимости экспериментов и автоматизации pipeline как первых шагах MLOps. Инвестиции в инфраструктуру обучения (GPU-кластер или облачные GPU) окупаются быстрее, чем попытки обойтись CPU-вычислениями для серьёзных задач.
FAQ о ML-платформах Q1 2025
Как санкции на GPU влияют на ML в России?
Критически. NVIDIA A100/H100 недоступны для официального импорта. Обучение крупных моделей ограничено имеющимися мощностями. Облачные GPU в дефиците, цены на 30–50% выше мировых. Компании вынуждены использовать модели меньшего размера, fine-tuning вместо обучения с нуля и open-source альтернативы.
Какая ML-платформа лучше для российской компании?
Yandex DataSphere — для команд, работающих в Yandex Cloud (лучший UX и набор сервисов). Cloud.ru ML Space — для enterprise с требованиями к безопасности и сертификации. On-premise стек (Kubeflow + MLflow) — для организаций, которым нельзя отдавать данные в облако.
Стоит ли внедрять MLOps, если у нас всего 2–3 модели?
Базовый MLOps — да. Даже для 2–3 моделей нужны версионирование (DVC или MLflow), автоматизация обучения (Airflow или pipeline DataSphere) и мониторинг (отслеживание accuracy и data drift). Полноценная MLOps-платформа оправдана при 10+ моделях в production.