Перейти к основному содержимому

Sampling параметры

Расширенные параметры для контроля генерации текста.

Pipeline выбора токенов

Все токены (vocabulary)

[top_k] → Оставляет K наиболее вероятных

[top_p] → Фильтрует по накопленной вероятности

[top_a] → Адаптивный cutoff

[min_p] → Отсекает по минимальной вероятности

[temperature] → Масштабирует распределение

[penalties] → Штрафует повторы

Выбор токена

Стандартные параметры

temperature

{"temperature": 0.7}
ЗначениеЭффект
0.0Детерминистичный
0.3-0.5Консервативный
0.7-0.9Сбалансированный
1.0-2.0Креативный

top_p (nucleus sampling)

{"top_p": 0.9}

Рассматривает токены, пока сумма вероятностей < top_p.

ЗначениеЭффект
0.1Очень узкий выбор
0.5Умеренный
0.9Широкий
1.0Без ограничений

frequency_penalty

{"frequency_penalty": 0.5}

Штраф за частоту использования токена. Чем чаще токен использовался, тем меньше шанс его повторения.

ЗначениеЭффект
-2.0Поощряет повторы
0.0Нейтрально
2.0Сильно штрафует повторы

presence_penalty

{"presence_penalty": 0.3}

Штраф за наличие токена в тексте. Поощряет использование новых слов/тем.

ЗначениеЭффект
-2.0Оставаться на теме
0.0Нейтрально
2.0Разнообразие тем

OpenRouter-specific параметры

Эти параметры поддерживаются через канал OpenRouter.

top_k

{"top_k": 40}

Рассматривает только K наиболее вероятных токенов.

ЗначениеЭффект
0Отключено (default)
10Очень узкий выбор
40Умеренный
100Широкий

top_a (adaptive)

{"top_a": 0.3}

Адаптивный cutoff: отсекает токены с вероятностью < top_a × max_probability.

ЗначениеЭффект
0.0Отключено (default)
0.1Слабый фильтр
0.5Средний фильтр
0.9Сильный фильтр

min_p

{"min_p": 0.05}

Отсекает токены с вероятностью < min_p × max_probability.

ЗначениеЭффект
0.0Отключено (default)
0.05Убирает очень маловероятные
0.1Умеренный фильтр
0.2Строгий фильтр

repetition_penalty

{"repetition_penalty": 1.1}

Альтернатива frequency_penalty. Множитель для штрафа за повторы.

ЗначениеЭффект
1.0Без эффекта
1.1Слабый штраф
1.3Умеренный
1.5Сильный

Примеры комбинаций

Для точных ответов (FAQ, техподдержка)

{
"model": "openrouter/google/gemini-2.5-flash",
"messages": [...],
"temperature": 0,
"top_p": 1.0
}

Для креативных текстов

{
"model": "openrouter/google/gemini-2.5-pro",
"messages": [...],
"temperature": 1.2,
"top_p": 0.95,
"top_k": 50,
"frequency_penalty": 0.5
}

Для разнообразных ответов без повторов

{
"model": "openrouter/deepseek/deepseek-chat",
"messages": [...],
"temperature": 0.8,
"repetition_penalty": 1.2,
"presence_penalty": 0.3
}

Для воспроизводимых результатов

{
"model": "gpt-4o",
"messages": [...],
"temperature": 0,
"seed": 42
}

Совместимость параметров

ПараметрAnthropicOpenAIOpenRouterGigaChatYandexGPT
temperature
top_p
max_tokens
frequency_penalty
presence_penalty
stop
seed
top_k
top_a
min_p
repetition_penalty

Граничные значения

ПараметрMinMaxDefault
temperature0.02.01.0
top_p0.01.01.0
top_k00 (off)
top_a0.01.00.0 (off)
min_p0.01.00.0 (off)
frequency_penalty-2.02.00.0
presence_penalty-2.02.00.0
repetition_penalty0.02.01.0
Ошибки валидации

При выходе за границы API вернёт ошибку:

{
"error": {
"message": "temperature must be between 0 and 2",
"type": "invalid_request_error",
"param": "temperature"
}
}