LLM для длинных документов

Договоры, книги, PDF — за один запрос
в России

Qwen 3.5 397B с контекстом 1 000 000 токенов — это ~750 страниц текста в одном промпте. Без RAG-индексов и резки на куски. Данные обрабатываются в РФ, 152-ФЗ.

1M
токенов в одном запросе
~750
страниц A4 за раз
1 000 ₽
welcome при регистрации
92%
точность поиска в 1M (RULER)

Что обрабатываем

4 типа задач где 1M контекста закрывает боль

Договоры и контракты

200-страничный договор целиком в одном промпте. Найди в нём пункты про штрафы, условия расторжения, сроки оплаты.

  • Юридический due diligence
  • Сравнение редакций договора
  • Извлечение ключевых условий

Книги и длинные PDF

Целая книга или научная статья за один запрос. Не нужно резать на куски и собирать ответ.

  • Конспект книги
  • Поиск ответа в учебнике
  • Анализ научной литературы

Корпоративная документация

Регламенты, нормативы, методички, политики — модель видит всё одновременно.

  • Q&A по внутренней базе знаний
  • Compliance-проверки
  • Обучение новых сотрудников

Кодовые базы

Загрузи монорепозиторий и спрашивай — где у нас обрабатывается X, как устроен модуль Y.

  • Code review длинного PR
  • Объяснение архитектуры
  • Поиск багов в legacy-коде

Как это работает

Загружаешь PDF, задаёшь вопрос — получаешь ответ

analyze-contract.py
from openai import OpenAI
import pdfplumber

# 1. Извлекаем текст из 200-страничного договора
with pdfplumber.open("contract.pdf") as pdf:
    contract = "\\n".join(p.extract_text() for p in pdf.pages)

# 2. Спрашиваем модель — весь документ в одном промпте
client = OpenAI(base_url="https://api.42gpu.ru/v1", api_key="sk-...")
response = client.chat.completions.create(
    model="local/qwen3.5-397b",
    messages=[{
        "role": "user",
        "content": f"Договор:\\n{contract}\\n\\nНайди условия о штрафах и расторжении."
    }],
)

print(response.choices[0].message.content)

Если документ дробный — например, набор PDF — каждый по отдельности извлекается в текст и склеивается в один промпт. До 750 страниц A4 умещается без потерь.

Вопросы про обработку документов

Старт за 2 минуты

Попробуйте на своём документе

Welcome-кредит 1 000 ₽ хватит на десятки длинных документов. Email + пароль — и работаете.

  • 1M контекста
  • Данные в РФ
  • OpenAI SDK работает