AI-разработка · Q2 2026 · Supporting
Vector databases в России 2026: Qdrant, Weaviate и отечественные альтернативы
Decision-матрица для RAG-команд: когда хватает pgvector, при каком объёме мигрировать на Qdrant, что даёт Weaviate, какие сценарии работают в облаках РФ под санкциями.
Получить PDF в кабинете
Регистрация за 30 секунд · доступ ко всем PDF тарифа Free
80%
RAG-проектов команд 10–50 человек закрываются на Postgres + pgvector без отдельной vector DB
5 мс
Типичная p95 Qdrant self-hosted на 10 млн векторов (768 dim) при корректной настройке HNSW
10–20 млн
Размер коллекции, при котором pgvector обычно достигает архитектурного предела
Ключевые выводы
6 наблюдений по выбору vector store в РФ
- 0180% пилотов не требуют отдельного движка. Для баз знаний до 2–5 млн фрагментов и умеренной частоты запросов расширение pgvector экономичнее и проще в сопровождении, чем отдельный векторный стек.
- 02Порог архитектурного перехода — 10–20 млн векторов. После этого у многих команд растут p95 и стоимость обслуживания индексов в Postgres, особенно при параллельной транзакционной нагрузке.
- 03Qdrant стабилен в диапазоне 5–15 мс p95 на 10 млн. При корректной памяти под граф HNSW и выделенном диске NVMe задержка обычно предсказуема даже при росте top-K.
- 04Weaviate выигрывает там, где критичны встроенные модули. Гибридный поиск, гибкая схема, multi-tenant из коробки полезны, но добавляют сложность эксплуатации.
- 05Managed подход снижает операционные риски на 30–40% по времени DevOps. Платите премию за сервис, но быстрее выходите в прод.
- 06Санкции делают self-hosted в облаках РФ базовым сценарием. Для high-trust доменов приоритет — Yandex Cloud / Cloud.ru с юридически прозрачной моделью доступа.
Что внутри PDF
13 страниц — decision-матрица и сценарии
01
Зачем vector database и 3 типа RAG-задач
02
Матрица выбора: pgvector / Qdrant / Weaviate / Milvus / РФ
03
Когда хватает pgvector (профиль команды и сигналы)
04
Когда переходить на Qdrant (триггеры, железо)
05
Когда выбирать Weaviate (vs Qdrant comparison)
06
Milvus и отечественные альтернативы
07
Санкции, размещение данных, managed-сервисы
08
TCO за 6 месяцев и порядок миграции (5 шагов)
Скачайте PDF — 13 страниц с цифрами и матрицей выбора
Регистрация в кабинете it-institute.ru открывает доступ ко всем исследованиям тарифа Free и сохраняет историю загрузок. Pro-тариф открывает аналитические обзоры и flagship-отчёты.
Получить PDF в кабинете
FAQ
Частые вопросы
Что выбрать для RAG в стартапе на 10 человек?
Для большинства стартапов на раннем этапе рационально начать с Postgres + pgvector, если уже есть реляционный контур и нет жёсткого SLA по retrieval. Это снижает число компонентов, упрощает наблюдаемость и ускоряет первые итерации.
Когда Postgres + pgvector перестаёт хватать?
Сочетание трёх факторов: объём за 10–20 млн векторов, смешанная нагрузка (поиск + транзакции) и p95 retrieval стабильно превышает целевой порог. Тогда специализированные движки дают более предсказуемую производительность.
Доступен ли Qdrant Cloud из России?
Доступность нестабильна по провайдерам и сетевой политике. Для критичного контура надёжнее self-hosted или managed в облаке РФ через VPC. Для R&D-пилотов внешний managed допустим, но с планом миграции.
Сколько ресурсов нужно для self-hosted Qdrant на 10M векторов?
Для практического старта: 8–16 vCPU, 64–128 ГБ RAM, NVMe-хранилище 500 ГБ – 1 ТБ. При 768-мерных векторах ключевое ограничение — память под индекс HNSW и кэш. Закладывайте запас 30% на пик и фоновую индексацию.
Где скачать полный PDF?
PDF с decision-матрицей, профилями платформ, TCO 6 мес и порядком миграции доступен после бесплатной регистрации в кабинете my.it-institute.ru.