Общие параметры
Параметры, поддерживаемые всеми моделями (OpenAI-compatible).
Основные параметры
temperature
Контролирует случайность генерации.
| Значение | Эффект |
|---|---|
| 0.0 | Детерминистичный (всегда один ответ) |
| 0.3 | Консервативный |
| 0.7 | Сбалансированный (default для большинства моделей) |
| 1.0 | Креативный |
| 2.0 | Максимальная случайность |
{
"model": "anthropic/claude-sonnet-4-5-20250929",
"messages": [...],
"temperature": 0.7
}
max_tokens
Максимальное количество токенов в ответе.
{
"model": "gpt-4o",
"messages": [...],
"max_tokens": 1000
}
Если не указать, модель сама определит длину ответа. Для контроля расходов рекомендуется указывать явно.
top_p
Nucleus sampling — модель рассматривает токены, пока сумма их вероятностей не достигнет top_p.
| Значение | Эффект |
|---|---|
| 0.1 | Очень узкий выбор (только самые вероятные) |
| 0.5 | Умеренный выбор |
| 0.9 | Широкий выбор |
| 1.0 | Без ограничений (default) |
{
"model": "gpt-4o",
"messages": [...],
"top_p": 0.9
}
Не рекомендуется использовать temperature и top_p одновременно. Выберите один параметр.
stop
Последовательности для остановки генерации.
{
"model": "gpt-4o",
"messages": [...],
"stop": ["END", "\n\n"]
}
Модель прекратит генерацию при встрече любой из указанных последовательностей.
stream
Включает потоковую передачу ответа.
{
"model": "gpt-4o",
"messages": [...],
"stream": true
}
При stream: true ответ приходит по частям (Server-Sent Events).
Параметры повторов
frequency_penalty
Штраф за частоту использования токенов. Снижает вероятность повторения часто используемых слов.
| Значение | Эффект |
|---|---|
| -2.0 | Поощряет повторения |
| 0.0 | Без эффекта (default) |
| 1.0 | Умеренный штраф |
| 2.0 | Сильный штраф за повторы |
{
"model": "gpt-4o",
"messages": [...],
"frequency_penalty": 0.5
}
presence_penalty
Штраф за наличие токена в тексте. Поощряет использование новых тем.
| Значение | Эффект |
|---|---|
| -2.0 | Поощряет оставаться на теме |
| 0.0 | Без эффекта (default) |
| 1.0 | Поощряет новые темы |
| 2.0 | Сильно поощряет разнообразие |
{
"model": "gpt-4o",
"messages": [...],
"presence_penalty": 0.3
}
Воспроизводимость
seed
Seed для воспроизводимых результатов. При одинаковом seed и temperature: 0 модель вернёт одинаковый ответ.
{
"model": "gpt-4o",
"messages": [...],
"temperature": 0,
"seed": 42
}
Не все модели поддерживают seed. Claude модели могут игнорировать этот параметр.
Формат сообщений
messages
Массив сообщений в формате chat:
{
"messages": [
{"role": "system", "content": "Ты полезный ассистент"},
{"role": "user", "content": "Привет!"},
{"role": "assistant", "content": "Привет! Чем могу помочь?"},
{"role": "user", "content": "Расскажи о погоде"}
]
}
Роли:
system— системные инструкции (необязательно)user— сообщения пользователяassistant— ответы модели
Мультимодальный контент
Для моделей с поддержкой изображений:
{
"messages": [
{
"role": "user",
"content": [
{"type": "text", "text": "Что на картинке?"},
{
"type": "image_url",
"image_url": {"url": "https://example.com/image.jpg"}
}
]
}
]
}
Полный пример
curl https://api.aipomogator.ru/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_KEY" \
-d '{
"model": "anthropic/claude-sonnet-4-5-20250929",
"messages": [
{"role": "system", "content": "Ты креативный писатель"},
{"role": "user", "content": "Напиши короткий рассказ о космосе"}
],
"temperature": 0.8,
"max_tokens": 500,
"frequency_penalty": 0.3,
"stream": false
}'