Зачем сравнивать российские LLM
С 2024 года российский рынок LLM вырос кратно: GigaChat от Сбера показал рост с 16K до 129K запросов в месяц, YandexGPT — с 10K до 46K. Для бизнеса это не просто цифры — это сигнал, что российские модели стали реальной альтернативой OpenAI и Anthropic.
Три причины выбирать российские LLM:
- 152-ФЗ — персональные данные обрабатываются в РФ
- Санкционные риски — OpenAI может ограничить доступ из России в любой момент
- Стоимость — российские модели дешевле западных аналогов на 30–70%
Но какую модель выбрать? В этой статье — объективное сравнение GigaChat, YandexGPT, ChatGPT и Claude по 10 критериям с конкретными рекомендациями.
Участники сравнения
| Модель | Разработчик | Страна | Запуск |
|---|---|---|---|
| GigaChat Pro / Max | Сбер | Россия | 2023 |
| YandexGPT Pro / Lite | Яндекс | Россия | 2023 |
| GPT-4o / GPT-4o-mini | OpenAI | США | 2023–2024 |
| Claude Sonnet / Haiku | Anthropic | США | 2024 |
Сравнение по 10 критериям
1. Качество на русском языке
| Модель | Грамматика | Стилистика | Понимание контекста | Сложные инструкции | Общая оценка |
|---|---|---|---|---|---|
| GigaChat Max | Отлично | Хорошо | Хорошо | Хорошо | 8/10 |
| YandexGPT Pro | Отлично | Отлично | Хорошо | Средне | 7.5/10 |
| GPT-4o | Отлично | Отлично | Отлично | Отлично | 9.5/10 |
| Claude Sonnet | Отлично | Отлично | Отлично | Отлично | 9/10 |
| GPT-4o-mini | Хорошо | Хорошо | Хорошо | Хорошо | 7.5/10 |
GPT-4o и Claude лидируют по общему качеству. GigaChat и YandexGPT хорошо справляются с типовыми задачами, но уступают на сложных многоступенчатых инструкциях.
2. Стоимость API
| Модель | Input (за 1M токенов) | Output (за 1M токенов) | Стоимость 1000 запросов (500 токенов вход, 300 выход) |
|---|---|---|---|
| GigaChat Lite | ~30 ₽ | ~30 ₽ | ~18 ₽ |
| GigaChat Pro | ~120 ₽ | ~120 ₽ | ~96 ₽ |
| GigaChat Max | ~400 ₽ | ~400 ₽ | ~320 ₽ |
| YandexGPT Lite | ~20 ₽ | ~40 ₽ | ~22 ₽ |
| YandexGPT Pro | ~80 ₽ | ~160 ₽ | ~88 ₽ |
| GPT-4o | ~250 ₽ | ~1000 ₽ | ~425 ₽ |
| GPT-4o-mini | ~15 ₽ | ~60 ₽ | ~25.5 ₽ |
| Claude Sonnet | ~300 ₽ | ~1500 ₽ | ~600 ₽ |
| Claude Haiku | ~25 ₽ | ~125 ₽ | ~50 ₽ |
Вывод: YandexGPT Lite и GPT-4o-mini — самые дешёвые. GigaChat Pro — оптимальный баланс цены и качества для российского рынка. GPT-4o и Claude Sonnet — в 3–5 раз дороже.
3. Контекстное окно
| Модель | Контекстное окно | Примерно в страницах A4 |
|---|---|---|
| GigaChat Lite | 8K токенов | ~6 страниц |
| GigaChat Pro | 32K токенов | ~24 страницы |
| GigaChat Max | 128K токенов | ~96 страниц |
| YandexGPT Lite | 8K токенов | ~6 страниц |
| YandexGPT Pro | 32K токенов | ~24 страницы |
| GPT-4o | 128K токенов | ~96 страниц |
| GPT-4o-mini | 128K токенов | ~96 страниц |
| Claude Sonnet | 200K токенов | ~150 страниц |
Claude Sonnet с 200K лидирует. GPT-4o и GigaChat Max — по 128K. Для RAG-систем с длинными документами размер контекста критичен.
4. Мультимодальность
| Модель | Понимание изображений | Генерация изображений | Аудио | Видео |
|---|---|---|---|---|
| GigaChat Max | Да | Да (Kandinsky) | Нет | Нет |
| YandexGPT Pro | Да | Да (YandexART) | Нет | Нет |
| GPT-4o | Да | Да (DALL-E 3) | Да | Нет |
| Claude Sonnet | Да | Нет | Нет | Нет |
GigaChat и YandexGPT обе поддерживают генерацию изображений через свои модели (Kandinsky и YandexART). GPT-4o — единственная с поддержкой аудио.
5. Function Calling / Tool Use
| Модель | Function Calling | Параллельные вызовы | JSON-mode | Качество |
|---|---|---|---|---|
| GigaChat Pro/Max | Да | Да | Да | Хорошее |
| YandexGPT Pro | Да (с ограничениями) | Нет | Да | Среднее |
| GPT-4o | Да | Да | Да | Отличное |
| Claude Sonnet | Да | Да | Да | Отличное |
Function calling критичен для AI-агентов и интеграций. GPT-4o и Claude лидируют по надёжности. GigaChat — хороший второй вариант. YandexGPT отстаёт в сложных сценариях.
6. 152-ФЗ и локализация данных
| Модель | Серверы в РФ | 152-ФЗ | Сертификация | Корпоративный договор |
|---|---|---|---|---|
| GigaChat | Да | Полное соответствие | ФСТЭК (в процессе) | Да (через Сбер) |
| YandexGPT | Да | Полное соответствие | ISO 27001 (Yandex Cloud) | Да (Yandex Cloud) |
| GPT-4o | Нет (США, Европа) | Не соответствует | SOC 2 Type II | Через партнёров |
| Claude | Нет (США) | Не соответствует | SOC 2 Type II | Enterprise API |
Если обрабатываете ПД (имена, телефоны, адреса) — только GigaChat или YandexGPT. Это не рекомендация, а требование закона.
7. Экосистема и интеграции
| Модель | SDK | LangChain | Облачная платформа | Встроенные сервисы |
|---|---|---|---|---|
| GigaChat | Python, JS | GigaChain (fork LangChain) | SberCloud | SberDevices, SmartMarket |
| YandexGPT | Python, JS | Да (нативная поддержка) | Yandex Cloud | DataSphere, Tracker, Wiki |
| GPT-4o | Python, JS, Go, .NET | Да | Azure OpenAI | Plugins, GPTs, Assistants |
| Claude | Python, JS | Да | AWS Bedrock | MCP, Artifacts |
YandexGPT выигрывает для компаний в экосистеме Яндекса (Cloud, Tracker, DataSphere). GigaChat — для экосистемы Сбера. GPT-4o — самая широкая экосистема.
8. Скорость генерации
| Модель | Tokens/sec (output) | Time to First Token |
|---|---|---|
| GigaChat Lite | 40–60 | 300–500 мс |
| GigaChat Pro | 30–50 | 500–800 мс |
| YandexGPT Lite | 50–70 | 200–400 мс |
| YandexGPT Pro | 30–50 | 400–700 мс |
| GPT-4o | 60–80 | 200–400 мс |
| GPT-4o-mini | 80–120 | 100–300 мс |
| Claude Sonnet | 50–70 | 300–500 мс |
GPT-4o-mini — самая быстрая. YandexGPT Lite — самая быстрая среди российских. Для чат-ботов, где важна отзывчивость, скорость имеет значение.
9. Fine-tuning
| Модель | Доступность | Метод | Минимум данных | Стоимость |
|---|---|---|---|---|
| GigaChat | По запросу (Enterprise) | SFT | от 500 примеров | По договору |
| YandexGPT | Да (DataSphere) | SFT, LoRA | от 100 примеров | от 500 ₽/эпоха |
| GPT-4o / mini | Да (API) | SFT | от 10 примеров | от $25/1M training tokens |
| Claude | Нет (только через AWS Bedrock) | — | — | — |
YandexGPT — самый доступный вариант fine-tuning среди российских моделей (через DataSphere). GigaChat — только для enterprise-клиентов Сбера.
10. Embeddings (для RAG)
| Модель | Embedding-модель | Размерность | Качество (рус.) | Стоимость |
|---|---|---|---|---|
| GigaChat | GigaChat Embeddings | 1024 | Хорошее | Включено в тариф |
| YandexGPT | text-search-doc/query | 256 | Хорошее | от 10 ₽/1M токенов |
| OpenAI | text-embedding-3-large | 3072 | Отличное | $0.13/1M токенов (~13 ₽) |
| OpenAI | text-embedding-3-small | 1536 | Хорошее | $0.02/1M токенов (~2 ₽) |
Для RAG-систем с 152-ФЗ: GigaChat Embeddings или YandexGPT Embeddings. Без ограничений: OpenAI text-embedding-3 — лучшее соотношение цены и качества.
Сводная таблица
| Критерий | GigaChat Pro | YandexGPT Pro | GPT-4o | Claude Sonnet |
|---|---|---|---|---|
| Качество (рус.) | 8/10 | 7.5/10 | 9.5/10 | 9/10 |
| Цена | Средняя | Низкая | Высокая | Высокая |
| Контекст | 32K (Max: 128K) | 32K | 128K | 200K |
| 152-ФЗ | Да | Да | Нет | Нет |
| Function Calling | Хорошо | Средне | Отлично | Отлично |
| Мультимодальность | Да | Да | Да + аудио | Только vision |
| Fine-tuning | Enterprise | DataSphere | API | Нет |
| Скорость | Средняя | Хорошая | Быстрая | Средняя |
| Экосистема | Сбер | Яндекс | Глобальная | AWS |
Матрица выбора: какую модель для какой задачи
| Задача | Лучший выбор | Альтернатива | Почему |
|---|---|---|---|
| AI чат-бот (с ПД клиентов) | GigaChat Pro | YandexGPT Pro | 152-ФЗ, хорошее качество |
| AI чат-бот (без ПД) | GPT-4o-mini | Claude Haiku | Дёшево, быстро, качественно |
| RAG по корпоративным документам | GigaChat Max | YandexGPT Pro + embeddings | Контекст 128K, 152-ФЗ |
| Анализ длинных документов | Claude Sonnet | GPT-4o | Контекст 200K |
| AI-агент с tool use | GPT-4o | Claude Sonnet | Лучший function calling |
| Генерация контента (маркетинг) | GPT-4o | GigaChat Pro | Качество текста |
| Классификация тикетов | YandexGPT Lite | GPT-4o-mini | Дёшево, быстро |
| Fine-tuning под домен | YandexGPT (DataSphere) | GPT-4o-mini | Доступный fine-tuning в РФ |
| Мультимодальные задачи | GPT-4o | GigaChat Max | Аудио + vision + генерация |
| Минимальный бюджет | YandexGPT Lite | GPT-4o-mini | 20–25 ₽/1M токенов |
Миграция с OpenAI на российские LLM
Что меняется
| Компонент | OpenAI | GigaChat | YandexGPT |
|---|---|---|---|
| Endpoint | api.openai.com | gigachat.devices.sberbank.ru | llm.api.cloud.yandex.net |
| Аутентификация | API Key | OAuth 2.0 (client credentials) | IAM Token (Yandex Cloud) |
| SDK | openai-python | gigachat-python | yandex-cloud-ml-sdk |
| LangChain | ChatOpenAI | GigaChat (через gigachain) | ChatYandexGPT |
| Формат ответа | OpenAI Chat Completions | Совместимый с OpenAI | Собственный формат |
Что не меняется
- RAG-пайплайн (retrieval, чанкинг, промпт-структура)
- Векторная БД и эмбеддинги (можно оставить OpenAI embeddings)
- Бизнес-логика и интеграции
План миграции
- Неделя 1: Поднять параллельный пайплайн с GigaChat/YandexGPT
- Неделя 2: Прогнать eval-датасет, сравнить метрики
- Неделя 3: A/B-тест на 10% трафика
- Неделя 4: Полный переход (если метрики ОК)
Ожидание: качество может упасть на 5–15% на сложных задачах. На типовых (FAQ, классификация, генерация) — разница минимальна.
Что дальше
Рынок российских LLM развивается быстро. GigaChat и YandexGPT закрывают 80% бизнес-задач при полном соответствии 152-ФЗ. Для задач, где критично максимальное качество — GPT-4o и Claude остаются лидерами, но требуют решения вопроса с персональными данными.
Нужна помощь с выбором и интеграцией LLM? Мы в Новаком внедряем AI-решения на любых моделях — от GigaChat до GPT-4o.
- Обсудить проект — бесплатная консультация 30 минут
- Внедрение ИИ в бизнес — с чего начать
- AI чат-бот для бизнеса — самый быстрый способ получить ROI
- RAG vs fine-tuning — выбор подхода к кастомизации