ML-платформы в России 2026 — это инфраструктурный фундамент, на котором строятся все AI-проекты: от fine-tuning языковых моделей до развёртывания computer vision в продакшене. В этом исследовании мы разбираем пять ключевых ML-платформ российского рынка, оцениваем GPU-ресурсы, сравниваем managed-сервисы и даём рекомендации для CTO и ML-лидов, выбирающих инфраструктуру для своих команд.
Ключевые выводы
- Рынок GenAI в России вырос в 4,5 раза за год — до 58 млрд ₽. ML-платформы — инфраструктурный фундамент этого роста. 70% AI-проектов используют GPU-ускорители (DelProf).
- Три ключевые ML-платформы: Yandex DataSphere (полный цикл ML, интеграция с YandexGPT), Cloud.ru ML Space (бывший Christofari, enterprise), VK Cloud ML Platform (PaaS с managed MLflow).
- GPU-дефицит — главный инфраструктурный барьер. Санкции ограничивают поставки NVIDIA H100/A100. Яндекс располагает крупнейшим кластером (10 000+ GPU), но для рынка в целом мощностей не хватает.
- Российские LLM достигли коммерческой зрелости: YandexGPT 5 (открытая Lite-версия + Pro через API), GigaChat (Сбер), T-Bank развивает собственные модели.
- MLOps в России — на ранней стадии. Yandex DataSphere, Cloud.ru ML Space и VK Cloud предлагают managed-среды с MLflow, но большинство компаний строят пайплайны вручную.
- 73% компаний экспериментируют с AI, но менее 10% в продакшене. Разрыв между пилотом и масштабированием — главная проблема ML-инфраструктуры.
Карта ML-платформ в России 2026
| Платформа | Провайдер | GPU | Ключевые сервисы | Позиционирование |
|---|---|---|---|---|
| Yandex DataSphere | Yandex Cloud | NVIDIA V100, A100, H100 | Jupyter-среда, обучение моделей, YandexGPT API, fine-tuning | Полный цикл ML для разработчиков |
| Cloud.ru ML Space | Cloud.ru (ex-SberCloud) | Christofari (NVIDIA A100) | Обучение LLM, HPC, enterprise ML | Enterprise и госсектор |
| VK Cloud ML Platform | VK Cloud | NVIDIA A100 | Managed MLflow, JupyterHub, GPU-аренда | PaaS для ML-команд |
| MTS AI Cloud | МТС Cloud | NVIDIA A100 | Готовые AI-сервисы, NLP, CV | Отраслевые решения |
| Selectel GPU | Selectel | NVIDIA A100, H100 | Bare metal GPU, Kubernetes с GPU-нодами | DevOps и ML-инженеры |
Рынок ML-платформ в России 2026 сегментирован по задачам: полный цикл ML (DataSphere), enterprise HPC (Cloud.ru), PaaS-аренда GPU (VK Cloud, Selectel) и отраслевые решения (MTS AI Cloud). Выбор платформы определяется не столько ценой, сколько типом задачи и уровнем зрелости ML-команды.
Yandex DataSphere: экосистема для полного цикла ML
Yandex DataSphere — флагманская ML-платформа Яндекса, интегрированная в Yandex Cloud. Ключевые возможности:
- Jupyter-среда с динамическим выделением GPU — платишь только за время вычислений
- Интеграция с YandexGPT — fine-tuning и инференс через API
- Yandex AI Studio — low-code платформа для создания AI-приложений на базе YandexGPT
- Поддержка MLflow для трекинга экспериментов
- GPU-кластер — 10 000+ GPU NVIDIA A100/H100, крупнейший в России
Яндекс делает ставку на экосистемный подход: DataSphere + YandexGPT API + AI Studio создают замкнутый цикл от эксперимента до продакшена. Для команд, которые уже используют Yandex Cloud, DataSphere — естественный выбор: единый биллинг, общие сети, бесшовная интеграция с Object Storage и Managed PostgreSQL.
Cloud.ru ML Space: enterprise-ML на базе Christofari
Cloud.ru (бывший SberCloud) развивает ML Space — платформу для обучения крупных моделей на суперкомпьютере Christofari. Ключевое преимущество — вычислительные мощности enterprise-класса и интеграция с экосистемой Сбера (GigaChat, GigaCode).
ML Space ориентирован на крупный бизнес и госсектор, где требуется обучение моделей на сотнях GPU одновременно. Платформа предоставляет готовые окружения для распределённого обучения (Horovod, DeepSpeed) и поддерживает интеграцию с Kubernetes через собственный оператор.
Cloud.ru предлагает гранты для стартапов, но их нельзя использовать на GPU и LLM (Хабр, январь 2026). У Яндекса только 25% гранта доступно на инфраструктуру. Это существенное ограничение для AI-стартапов с ограниченным бюджетом.
MLOps-практики на российских ML-платформах
MLOps — дисциплина, которая переводит ML-модели из Jupyter-ноутбуков в надёжный продакшен. На российском рынке ML-платформ 2026 зрелость MLOps-инструментов сильно различается.
| Компонент MLOps | Yandex DataSphere | Cloud.ru ML Space | VK Cloud |
|---|---|---|---|
| Трекинг экспериментов | MLflow (managed) | Собственный трекер + MLflow | Managed MLflow |
| CI/CD для моделей | Интеграция с Yandex Serverless | Jenkins / GitLab CI | GitLab CI + Kubernetes |
| Model Registry | DataSphere Models | ML Space Registry | MLflow Model Registry |
| Мониторинг дрифта | Ручной (Prometheus + Grafana) | Ручной | Ручной |
| Feature Store | Нет (Yandex YDB как альтернатива) | Нет | Нет |
Ключевой вывод: ни одна ML-платформа в России пока не предлагает полноценный managed Feature Store или автоматический мониторинг дрифта данных. Компании, выводящие модели в продакшен, вынуждены строить эти компоненты самостоятельно — на базе Feast, Evidently AI или собственных решений. Это увеличивает порог входа и объясняет, почему менее 10% AI-проектов доходят до продакшена.
Российские LLM: кто создаёт модели
| Модель | Компания | Параметры | Доступ | Стоимость API |
|---|---|---|---|---|
| YandexGPT 5 Pro | Яндекс | Не раскрывается | API (Yandex Cloud) | 0,0098 $/1000 токенов |
| YandexGPT 5 Lite | Яндекс | 8 млрд | Open-source | Бесплатно |
| GigaChat Pro | Сбер | Не раскрывается | API (developers.sber.ru) | По тарифу |
| T-Bank LLM | T-Bank | Не раскрывается | Внутреннее использование | — |
YandexGPT 5 Lite Pretrain (открытая модель, февраль 2025) — важный шаг: российские компании могут делать fine-tuning на собственных данных без зависимости от закрытых API. Яндекс также открыл доступ к DeepSeek V3.2 через Yandex Cloud (0,0041 $/1000 входных токенов).
GPU-дефицит: главный инфраструктурный барьер
Санкции ограничивают поставки высокопроизводительных GPU NVIDIA (H100, A100) в Россию. Это создаёт дефицит вычислительных мощностей для обучения моделей:
| Провайдер | Доступные GPU | Особенности |
|---|---|---|
| Yandex Cloud | V100, A100, H100 | Крупнейший кластер 10 000+ GPU, динамическое выделение |
| Cloud.ru | A100 (Christofari) | Суперкомпьютер для обучения LLM |
| Selectel | A100, H100 | Bare metal GPU, SLA |
| VK Cloud | A100 | Managed Kubernetes с GPU-нодами |
На практике GPU-дефицит означает не просто более высокие цены. Для ML-платформ в России 2026 характерны очереди на выделение GPU-ресурсов: время ожидания A100 у некоторых провайдеров достигает 2–4 недель. Команды, планирующие обучение крупных моделей, должны резервировать слоты заблаговременно.
Для обучения LLM масштаба YandexGPT 5 требуются тысячи GPU на недели. Мощностей в России хватает нескольким крупнейшим компаниям. Средний бизнес ограничен fine-tuning существующих моделей и инференсом через API. Альтернативы NVIDIA (Huawei Ascend) пока не достигли зрелости для массового рынка.
Рекомендации
- Не обучайте модели с нуля. Для 90% задач достаточно fine-tuning YandexGPT 5 Lite (open-source) или вызова API (YandexGPT Pro, GigaChat). Обучение с нуля — привилегия Яндекса и Сбера.
- Выбирайте ML-платформу по задаче. Yandex DataSphere — для полного цикла ML. Cloud.ru ML Space — для enterprise и HPC. VK Cloud — для PaaS и managed MLflow. Selectel — для bare metal и контроля.
- Инвестируйте в MLOps. Managed MLflow (VK Cloud, DataSphere), CI/CD для моделей, мониторинг дрифта — это не роскошь, а необходимость для моделей в продакшене.
- Планируйте GPU-бюджет заранее. GPU-мощности ограничены и дорожают. Резервируйте слоты у облачных провайдеров за 1–3 месяца до начала обучения.
- Следите за open-source-моделями. YandexGPT 5 Lite, DeepSeek V3.2 через Yandex Cloud — возможность получить качественный инференс без привязки к одному вендору.
FAQ о ML-платформах в России 2026
Какие ML-платформы доступны в России?
Основные ML-платформы в России 2026: Yandex DataSphere (полный цикл ML), Cloud.ru ML Space (enterprise, Christofari), VK Cloud ML Platform (PaaS, managed MLflow), MTS AI Cloud (отраслевые решения), Selectel GPU (bare metal). Все предлагают GPU NVIDIA и интеграцию с Kubernetes.
Какой GPU-кластер самый мощный в России?
Яндекс располагает крупнейшим ML-кластером — более 10 000 GPU NVIDIA A100/H100. Cloud.ru (Christofari) — второй по мощности, ориентирован на обучение LLM для enterprise. Selectel и VK Cloud предлагают GPU-аренду для меньших задач.
Какие российские LLM доступны для бизнеса?
YandexGPT 5 Pro (API, 0,0098 $/1000 токенов), YandexGPT 5 Lite (open-source, 8 млрд параметров), GigaChat Pro (Сбер, API). Также через Yandex Cloud доступен DeepSeek V3.2 (0,0041 $/1000 токенов).
Как GPU-дефицит влияет на AI-разработку в России?
Санкции ограничивают поставки NVIDIA H100/A100. Обучение LLM с нуля доступно единицам (Яндекс, Сбер). Средний бизнес ограничен fine-tuning и инференсом через API. Альтернативы (Huawei Ascend) не достигли зрелости.
С чего начать ML-инфраструктуру в российской компании?
1) Определить задачу (fine-tuning vs обучение vs инференс). 2) Выбрать платформу (DataSphere для полного цикла, VK Cloud для PaaS). 3) Начать с managed-сервисов, не строить инфраструктуру с нуля. 4) Внедрить MLOps (MLflow, CI/CD для моделей) с первого дня.
ML-платформы в России 2026 — это рынок, где инфраструктура определяет возможности. Яндекс с 10 000+ GPU и экосистемой DataSphere + YandexGPT задаёт стандарт. Cloud.ru покрывает enterprise-сегмент. Для остального рынка ключевой вопрос — не «какую модель обучить», а «хватит ли GPU». Санкции создали структурный дефицит вычислительных мощностей, который не решается в краткосрочной перспективе. Прагматичная стратегия для большинства компаний: fine-tuning открытых моделей (YandexGPT 5 Lite) + инференс через API + managed MLOps. Обучение с нуля — удел единиц.
- Закрытые данные о GPU-кластерах. Точное количество GPU у Cloud.ru, VK Cloud и МТС Cloud не раскрывается. Оценка 10 000+ GPU у Яндекса — из открытых источников, не подтверждена компанией.
- Быстрая динамика рынка. Модели и сервисы обновляются ежемесячно. Ценообразование YandexGPT может измениться.
- Смещение к крупным провайдерам. Нишевые ML-платформы (Vox Mentis, SistemmaGPT) не охвачены в обзоре.
Исследование подготовлено редакцией it-institute.ru на основе анализа открытых источников. Дата подготовки: март 2026.