Общие параметры

Параметры, поддерживаемые всеми моделями (OpenAI-compatible).

Основные параметры

temperature

Контролирует случайность генерации.

Значение	Эффект
0.0	Детерминистичный (всегда один ответ)
0.3	Консервативный
0.7	Сбалансированный (default для большинства моделей)
1.0	Креативный
2.0	Максимальная случайность

{
  "model": "anthropic/claude-sonnet-4-5-20250929",
  "messages": [...],
  "temperature": 0.7
}

max_tokens

Максимальное количество токенов в ответе.

{
  "model": "gpt-4o",
  "messages": [...],
  "max_tokens": 1000
}

подсказка

Если не указать, модель сама определит длину ответа. Для контроля расходов рекомендуется указывать явно.

top_p

Nucleus sampling — модель рассматривает токены, пока сумма их вероятностей не достигнет top_p.

Значение	Эффект
0.1	Очень узкий выбор (только самые вероятные)
0.5	Умеренный выбор
0.9	Широкий выбор
1.0	Без ограничений (default)

{
  "model": "gpt-4o",
  "messages": [...],
  "top_p": 0.9
}

warning

Не рекомендуется использовать temperature и top_p одновременно. Выберите один параметр.

stop

Последовательности для остановки генерации.

{
  "model": "gpt-4o",
  "messages": [...],
  "stop": ["END", "\n\n"]
}

Модель прекратит генерацию при встрече любой из указанных последовательностей.

stream

Включает потоковую передачу ответа.

{
  "model": "gpt-4o",
  "messages": [...],
  "stream": true
}

При stream: true ответ приходит по частям (Server-Sent Events).

Параметры повторов

frequency_penalty

Штраф за частоту использования токенов. Снижает вероятность повторения часто используемых слов.

Значение	Эффект
-2.0	Поощряет повторения
0.0	Без эффекта (default)
1.0	Умеренный штраф
2.0	Сильный штраф за повторы

{
  "model": "gpt-4o",
  "messages": [...],
  "frequency_penalty": 0.5
}

presence_penalty

Штраф за наличие токена в тексте. Поощряет использование новых тем.

Значение	Эффект
-2.0	Поощряет оставаться на теме
0.0	Без эффекта (default)
1.0	Поощряет новые темы
2.0	Сильно поощряет разнообразие

{
  "model": "gpt-4o",
  "messages": [...],
  "presence_penalty": 0.3
}

Воспроизводимость

seed

Seed для воспроизводимых результатов. При одинаковом seed и temperature: 0 модель вернёт одинаковый ответ.

{
  "model": "gpt-4o",
  "messages": [...],
  "temperature": 0,
  "seed": 42
}

примечание

Не все модели поддерживают seed. Claude модели могут игнорировать этот параметр.

Формат сообщений

messages

Массив сообщений в формате chat:

{
  "messages": [
    {"role": "system", "content": "Ты полезный ассистент"},
    {"role": "user", "content": "Привет!"},
    {"role": "assistant", "content": "Привет! Чем могу помочь?"},
    {"role": "user", "content": "Расскажи о погоде"}
  ]
}

Роли:

system — системные инструкции (необязательно)
user — сообщения пользователя
assistant — ответы модели

Мультимодальный контент

Для моделей с поддержкой изображений:

{
  "messages": [
    {
      "role": "user",
      "content": [
        {"type": "text", "text": "Что на картинке?"},
        {
          "type": "image_url",
          "image_url": {"url": "https://example.com/image.jpg"}
        }
      ]
    }
  ]
}

Полный пример

curl https://api.aipomogator.ru/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $API_KEY" \
  -d '{
    "model": "anthropic/claude-sonnet-4-5-20250929",
    "messages": [
      {"role": "system", "content": "Ты креативный писатель"},
      {"role": "user", "content": "Напиши короткий рассказ о космосе"}
    ],
    "temperature": 0.8,
    "max_tokens": 500,
    "frequency_penalty": 0.3,
    "stream": false
  }'

Основные параметры​

temperature​

max_tokens​

top_p​

stop​

stream​

Параметры повторов​

frequency_penalty​

presence_penalty​

Воспроизводимость​

seed​

Формат сообщений​

messages​

Мультимодальный контент​

Полный пример​