Перейти к основному содержимому

OpenRouter

Relay канал для доступа к множеству моделей через единый API OpenRouter.

Поддерживаемые модели

Google Gemini

МодельОписаниеInputOutput
openrouter/google/gemini-2.5-proGemini 2.5 Pro$2.50$10.00
openrouter/google/gemini-2.5-flashGemini 2.5 Flash (быстрый)$0.15$0.60
openrouter/google/gemini-3-pro-image-previewGemini 3 Pro Image$2.00$12.00

DeepSeek

МодельОписаниеInputOutput
openrouter/deepseek/deepseek-v3.2DeepSeek V3.2$0.27$1.10
openrouter/deepseek/deepseek-chatDeepSeek Chat$0.14$0.28
openrouter/deepseek/deepseek-r1DeepSeek R1 (reasoning)$0.55$2.19

Другие модели

МодельОписаниеInputOutput
openrouter/qwen/qwen2.5-coder-7b-instructQwen Coder$0.03$0.09
openrouter/bytedance/seedream-4.5SeDream (изображения)$0.00$9.58

Цены указаны в USD за 1M токенов

Базовый пример

curl https://api.aipomogator.ru/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_KEY" \
-d '{
"model": "openrouter/google/gemini-2.5-flash",
"messages": [
{"role": "user", "content": "Привет! Расскажи о себе."}
]
}'

Sampling параметры

OpenRouter поддерживает расширенный набор параметров для контроля генерации.

Стандартные параметры (OpenAI-compatible)

ПараметрТипRangeDefaultОписание
temperaturefloat0.0–2.01.0Случайность генерации
top_pfloat0.0–1.01.0Nucleus sampling
max_tokensint1+variesМакс. токенов в ответе
frequency_penaltyfloat-2.0–2.00.0Штраф за повторы
presence_penaltyfloat-2.0–2.00.0Штраф за уже использованные темы
stopstring/arraynullСтоп-последовательности
seedintanynullSeed для воспроизводимости

OpenRouter-specific параметры

ПараметрТипRangeDefaultОписание
top_kint0+0Top-K sampling (0 = disabled)
top_afloat0.0–1.00.0Adaptive sampling
min_pfloat0.0–1.00.0Minimum probability cutoff
repetition_penaltyfloat0.0–2.01.0Альтернатива frequency_penalty

Пример с sampling параметрами

curl https://api.aipomogator.ru/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_KEY" \
-d '{
"model": "openrouter/google/gemini-2.5-flash",
"messages": [
{"role": "user", "content": "Напиши креативный рассказ"}
],
"temperature": 0.8,
"top_p": 0.95,
"top_k": 40,
"max_tokens": 500
}'

Как работает pipeline выбора токенов

Все токены (vocab)

[top_k] → Оставляет K наиболее вероятных

[top_p] → Оставляет токены до накопления вероятности P

[top_a] → Адаптивный cutoff по max_prob

[min_p] → Отсекает токены с вероятностью < min_p * max_prob

[temperature] → Масштабирует распределение

[penalties] → Применяет штрафы за повторы

Выбор финального токена

Комбинации параметров

Для точных ответов:

{
"temperature": 0,
"top_p": 1.0,
"seed": 42
}

Для креативных текстов:

{
"temperature": 1.2,
"top_p": 0.9,
"top_k": 50,
"frequency_penalty": 0.5
}

Для разнообразия без повторов:

{
"temperature": 0.8,
"repetition_penalty": 1.2,
"presence_penalty": 0.3
}

Streaming

curl https://api.aipomogator.ru/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_KEY" \
-d '{
"model": "openrouter/google/gemini-2.5-flash",
"messages": [{"role": "user", "content": "Привет!"}],
"stream": true
}'

DeepSeek R1 (Reasoning)

DeepSeek R1 — модель с расширенными возможностями рассуждения:

{
"model": "openrouter/deepseek/deepseek-r1",
"messages": [
{"role": "user", "content": "Реши задачу: если поезд едет со скоростью 60 км/ч, за сколько времени он проедет 180 км?"}
]
}

Генерация изображений (SeDream)

{
"model": "openrouter/bytedance/seedream-4.5",
"messages": [
{"role": "user", "content": "Нарисуй закат над горами в стиле импрессионизма"}
]
}