Name: Nous Hermes 2
Author: Nous Research

Question 1

Что такое Nous Hermes 2 и кто её сделал?

Accepted Answer

Nous Hermes 2 — open-source языковая модель от исследовательской группы Nous Research, выпущенная в январе 2024 года. Флагман линейки — Nous-Hermes-2-Mixtral-8x7B-DPO, файнтюн Mixtral 8x7B от Mistral AI, обученный методом Direct Preference Optimization на корпусе из 1+ миллиона записей преимущественно от GPT-4. Веса распространяются по лицензии Apache 2.0.

Question 2

На какой базовой модели построена и почему MoE важно?

Accepted Answer

Nous Hermes 2 Mixtral DPO построена на архитектуре Mixtral 8x7B — Mixture of Experts от Mistral AI. У модели 46.7 миллиардов параметров суммарно, разнесённых на 8 экспертных подсетей по ~7B каждая. На каждом токене активны только два эксперта — это 12.9 миллиардов параметров. На практике это даёт скорость 13B-модели при качестве 70B+, что особенно полезно при локальном запуске.

Question 3

Какие требования к железу для локального запуска?

Accepted Answer

Минимум 28 GB VRAM для Q4-квантизации (например, RTX 3090/4090 с разгрузкой части слоёв в RAM). Полные веса в fp16 требуют около 94 GB VRAM — нужны A100 80GB или серверные конфигурации с несколькими GPU. Для CPU-запуска через llama.cpp и GGUF-кванты от TheBloke нужно 32-64 GB RAM, но скорость будет ниже — единицы токенов в секунду.

Question 4

Можно ли использовать Nous Hermes 2 коммерчески?

Accepted Answer

Да, лицензия Apache 2.0 разрешает коммерческое использование, модификацию и распространение модели без отчислений и без согласований с автором. Вы можете развернуть модель на своих серверах, использовать в платных продуктах, обучить собственный fine-tune и распространять полученное под любой лицензией.

Question 5

Работает ли модель в России и поддерживает ли русский язык?

Accepted Answer

Open-source веса с HuggingFace не блокируются — модель можно скачать и запускать локально где угодно. Однако сама модель обучена в основном на англоязычных данных, поэтому русский язык работает с заметным качественным провалом по сравнению с английским. Для русскоязычных задач сейчас лучше смотреть на Qwen 3, DeepSeek R1 или специализированные русские модели (YandexGPT, GigaChat).

Question 6

Есть ли API и какие варианты использования без локального GPU?

Accepted Answer

Официального бесплатного API от Nous Research для Hermes 2 нет. Облачный доступ возможен через OpenRouter (~$0.5–1 за 1M токенов, OpenAI-совместимый API, принимает криптовалюту), Together AI или Replicate. Это удобно для тестирования модели перед on-premise деплоем или для эпизодических задач без своей инфраструктуры.

Question 7

Чем отличается DPO версия от SFT?

Accepted Answer

SFT (Supervised Fine-Tuning) — базовый этап дообучения на размеченных диалогах. DPO (Direct Preference Optimization) — дополнительный этап, где модель учится на парах «хороший/плохой ответ» и подстраивается под человеческие предпочтения. DPO-версия Nous Hermes 2 Mixtral в среднем даёт более качественные и помогающие ответы, лучше следует инструкциям. Для большинства задач рекомендуется именно DPO; SFT-вариант может быть полезен как стартовая точка для собственного дообучения.

Question 8

Какие модели Nous Research стоит смотреть для новых проектов?

Accepted Answer

Для актуальных задач — Hermes 3 (август 2024, на Llama 3.1) или Hermes 4 (январь–сентябрь 2025, гибридное рассуждение, варианты 14B/70B/405B). Свежий флагман — Hermes 4.3 (август 2025) на базе ByteDance Seed 36B: 70B-уровень качества в плотной 36B-архитектуре, контекст 512K токенов, обучена через децентрализованную сеть Psyche. Hermes 2 остаётся актуальной только если она уже встроена в продакшен или критичен компактный MoE.

Nous Hermes 2

Рейтинг и бенчмарки

Входные и выходные данные

API и стоимость

Способы доступа

Сценарии использования

Тарифы и подписки — Nous Research

Плюсы и минусы

Подробный обзор

Что такое Nous Hermes 2

Архитектура и обучение

Производительность и бенчмарки

Место в линейке Nous Research

Доступность и особенности использования

Часто задаваемые вопросы

Все эти инструменты — уже на Genova-ai

Похожие модели