Alltokens

Предпросмотр маршрута

API, быстрый старт и гайды. Совместимо с OpenAI chat completions и streaming.

Route preview

POST https://api.alltokens.ru/api/v1/route/preview
Content-Type: application/json

Превью маршрутизации без вызова модели: топ-N кандидатов с учётом цели и ограничений по каталогу моделей.

Заголовки

ЗаголовокОбязательный
Authorization: Bearer <API_KEY>Да
Content-Type: application/jsonДа

Тело запроса

Минимально — пустой объект {}. Параметры маршрутизации в metadata или extra_body:

ПолеТипОписание
modelstringОпционально. Контекст модели
metadata / extra_bodyobjectСм. ниже

Внутри metadata или extra_body

ПолеТипОписание
objectivestringcheapest, fastest, balanced
max_cost_per_1k_tokensnumberМакс. стоимость за 1k токенов (USD)
allowed_modelsstring[]Разрешённые модели/паттерны
blocked_modelsstring[]Исключаемые модели/паттерны
top_nnumberЧисло кандидатов (1..50, по умолчанию 10)

Пример (curl)

bash
curl -X POST "https://api.alltokens.ru/api/v1/route/preview" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "metadata": {
      "objective": "cheapest",
      "max_cost_per_1k_tokens": 0.01,
      "top_n": 5
    }
  }'

Ответ (200)

Корневой объект:

ПолеТипОписание
candidatesarrayМассив кандидатов (см. ниже)
winnerReasonstringПричина выбора лучшего: cheapest_under_budget, fastest_available, balanced_best_match, unable_to_fetch_models, invalid_models_response, no_models_data
estimatedCostPer1KInputnumber | nullОценка стоимости за 1k токенов входа (USD)
estimatedCostPer1KOutputnumber | nullОценка стоимости за 1k токенов выхода (USD)

Элемент candidates[]

ПолеТипОписание
modelIdstringИдентификатор модели
namestringНазвание модели
promptPricePerMillionnumber | nullЦена за 1M токенов промпта (USD)
completionPricePerMillionnumber | nullЦена за 1M токенов ответа (USD)
estimatedCostPer1KTokensnumber | nullОценка за 1k токенов (USD)
latencyEstimateP50Msnumber | nullОценка латентности P50 (мс), пока не заполняется
latencyEstimateP95Msnumber | nullОценка латентности P95 (мс), пока не заполняется
healthScorenumber | nullОценка здоровья, пока не заполняется

Коды ответов

КодОписание
200Успех
400Неверное тело (не JSON и т.д.)
401Не авторизован
500Ошибка при построении превью