Sampling параметры

Расширенные параметры для контроля генерации текста.

Pipeline выбора токенов

Все токены (vocabulary)
        ↓
   [top_k] → Оставляет K наиболее вероятных
        ↓
   [top_p] → Фильтрует по накопленной вероятности
        ↓
   [top_a] → Адаптивный cutoff
        ↓
   [min_p] → Отсекает по минимальной вероятности
        ↓
[temperature] → Масштабирует распределение
        ↓
 [penalties] → Штрафует повторы
        ↓
   Выбор токена

Стандартные параметры

temperature

{"temperature": 0.7}

Значение	Эффект
0.0	Детерминистичный
0.3-0.5	Консервативный
0.7-0.9	Сбалансированный
1.0-2.0	Креативный

top_p (nucleus sampling)

{"top_p": 0.9}

Рассматривает токены, пока сумма вероятностей < top_p.

Значение	Эффект
0.1	Очень узкий выбор
0.5	Умеренный
0.9	Широкий
1.0	Без ограничений

frequency_penalty

{"frequency_penalty": 0.5}

Штраф за частоту использования токена. Чем чаще токен использовался, тем меньше шанс его повторения.

Значение	Эффект
-2.0	Поощряет повторы
0.0	Нейтрально
2.0	Сильно штрафует повторы

presence_penalty

{"presence_penalty": 0.3}

Штраф за наличие токена в тексте. Поощряет использование новых слов/тем.

Значение	Эффект
-2.0	Оставаться на теме
0.0	Нейтрально
2.0	Разнообразие тем

OpenRouter-specific параметры

Эти параметры поддерживаются через канал OpenRouter.

top_k

{"top_k": 40}

Рассматривает только K наиболее вероятных токенов.

Значение	Эффект
0	Отключено (default)
10	Очень узкий выбор
40	Умеренный
100	Широкий

top_a (adaptive)

{"top_a": 0.3}

Адаптивный cutoff: отсекает токены с вероятностью < top_a × max_probability.

Значение	Эффект
0.0	Отключено (default)
0.1	Слабый фильтр
0.5	Средний фильтр
0.9	Сильный фильтр

min_p

{"min_p": 0.05}

Отсекает токены с вероятностью < min_p × max_probability.

Значение	Эффект
0.0	Отключено (default)
0.05	Убирает очень маловероятные
0.1	Умеренный фильтр
0.2	Строгий фильтр

repetition_penalty

{"repetition_penalty": 1.1}

Альтернатива frequency_penalty. Множитель для штрафа за повторы.

Значение	Эффект
1.0	Без эффекта
1.1	Слабый штраф
1.3	Умеренный
1.5	Сильный

Примеры комбинаций

Для точных ответов (FAQ, техподдержка)

{
  "model": "openrouter/google/gemini-2.5-flash",
  "messages": [...],
  "temperature": 0,
  "top_p": 1.0
}

Для креативных текстов

{
  "model": "openrouter/google/gemini-2.5-pro",
  "messages": [...],
  "temperature": 1.2,
  "top_p": 0.95,
  "top_k": 50,
  "frequency_penalty": 0.5
}

Для разнообразных ответов без повторов

{
  "model": "openrouter/deepseek/deepseek-chat",
  "messages": [...],
  "temperature": 0.8,
  "repetition_penalty": 1.2,
  "presence_penalty": 0.3
}

Для воспроизводимых результатов

{
  "model": "gpt-4o",
  "messages": [...],
  "temperature": 0,
  "seed": 42
}

Совместимость параметров

Параметр	Anthropic	OpenAI	OpenRouter	GigaChat	YandexGPT
temperature	✅	✅	✅	✅	✅
top_p	✅	✅	✅	✅	✅
max_tokens	✅	✅	✅	✅	✅
frequency_penalty	✅	✅	✅	❌	❌
presence_penalty	✅	✅	✅	❌	❌
stop	✅	✅	✅	✅	✅
seed	❌	✅	✅	❌	❌
top_k	❌	❌	✅	❌	❌
top_a	❌	❌	✅	❌	❌
min_p	❌	❌	✅	❌	❌
repetition_penalty	❌	❌	✅	❌	❌

Граничные значения

Параметр	Min	Max	Default
temperature	0.0	2.0	1.0
top_p	0.0	1.0	1.0
top_k	0	∞	0 (off)
top_a	0.0	1.0	0.0 (off)
min_p	0.0	1.0	0.0 (off)
frequency_penalty	-2.0	2.0	0.0
presence_penalty	-2.0	2.0	0.0
repetition_penalty	0.0	2.0	1.0

Ошибки валидации

При выходе за границы API вернёт ошибку:

{
  "error": {
    "message": "temperature must be between 0 and 2",
    "type": "invalid_request_error",
    "param": "temperature"
  }
}

Pipeline выбора токенов​

Стандартные параметры​

temperature​

top_p (nucleus sampling)​

frequency_penalty​

presence_penalty​

OpenRouter-specific параметры​

top_k​

top_a (adaptive)​

min_p​

repetition_penalty​

Примеры комбинаций​

Для точных ответов (FAQ, техподдержка)​

Для креативных текстов​

Для разнообразных ответов без повторов​

Для воспроизводимых результатов​

Совместимость параметров​

Граничные значения​