Quickstart API

Проверить 42gpu API первым запросом

Эта страница для технической проверки: зарегистрироваться, получить ключ в дашборде и отправить запрос к текущему open-source baseline через OpenAI-совместимый API.

Параметры

Endpoint и модель

42gpu API совместим с OpenAI SDK. Для проверки достаточно заменить base_url, api_key и model.

Base URL

https://api.42gpu.ru/vllm/v1

Model

Qwen/Qwen3.5-397B-A17B-GPTQ-Int4

API key

Ключ выглядит как sk-... и создаётся в дашборде после регистрации.

1. Установите SDK

Terminal
pip install openai

2. Отправьте первый запрос

Используйте стандартный OpenAI Python SDK, Node.js SDK или прямой HTTP-запрос. Запросы обрабатываются в контуре 42gpu, а содержимое запросов не используется для обучения модели.
quickstart.py
from openai import OpenAI

client = OpenAI(
    base_url="https://api.42gpu.ru/vllm/v1",
    api_key="sk-..."  # ваш API-ключ из дашборда
)

response = client.chat.completions.create(
    model="Qwen/Qwen3.5-397B-A17B-GPTQ-Int4",
    messages=[
        {"role": "system", "content": "Ты полезный ассистент."},
        {"role": "user", "content": "Объясни квантовые вычисления простыми словами."}
    ],
    max_tokens=512
)

print(response.choices[0].message.content)
curl
curl https://api.42gpu.ru/vllm/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-..." \
  -d '{
    "model": "Qwen/Qwen3.5-397B-A17B-GPTQ-Int4",
    "messages": [
      {"role": "user", "content": "Привет! Как дела?"}
    ],
    "max_tokens": 256
  }'
index.ts
import OpenAI from 'openai';

const client = new OpenAI({
  baseURL: 'https://api.42gpu.ru/vllm/v1',
  apiKey: 'sk-...',
});

const response = await client.chat.completions.create({
  model: 'Qwen/Qwen3.5-397B-A17B-GPTQ-Int4',
  messages: [{ role: 'user', content: 'Привет!' }],
});

console.log(response.choices[0].message.content);

3. Streaming

streaming.py
from openai import OpenAI

client = OpenAI(
    base_url="https://api.42gpu.ru/vllm/v1",
    api_key="sk-..."
)

stream = client.chat.completions.create(
    model="Qwen/Qwen3.5-397B-A17B-GPTQ-Int4",
    messages=[{"role": "user", "content": "Напиши короткий текст про GPU"}],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

Доступная модель

modelНазваниеInput ₽/1KOutput ₽/1KКонтекст
Qwen/Qwen3.5-397B-A17B-GPTQ-Int4Qwen 3.5 397B0.06 ₽0.32 ₽1M

Для проверки дадим тестовый баланс 1000 ₽

Если техническая команда хочет проверить качество модели руками, зарегистрируйтесь и получите API-ключ. Для корпоративного запуска лучше сначала согласовать сценарий, данные и ограничения.

Зарегистрироваться