Договоры, книги, PDF — за один запрос
в России
Qwen 3.5 397B с контекстом 1 000 000 токенов — это ~750 страниц текста в одном промпте. Без RAG-индексов и резки на куски. Данные обрабатываются в РФ, 152-ФЗ.
Что обрабатываем
4 типа задач где 1M контекста закрывает боль
Договоры и контракты
200-страничный договор целиком в одном промпте. Найди в нём пункты про штрафы, условия расторжения, сроки оплаты.
- Юридический due diligence
- Сравнение редакций договора
- Извлечение ключевых условий
Книги и длинные PDF
Целая книга или научная статья за один запрос. Не нужно резать на куски и собирать ответ.
- Конспект книги
- Поиск ответа в учебнике
- Анализ научной литературы
Корпоративная документация
Регламенты, нормативы, методички, политики — модель видит всё одновременно.
- Q&A по внутренней базе знаний
- Compliance-проверки
- Обучение новых сотрудников
Кодовые базы
Загрузи монорепозиторий и спрашивай — где у нас обрабатывается X, как устроен модуль Y.
- Code review длинного PR
- Объяснение архитектуры
- Поиск багов в legacy-коде
Как это работает
Загружаешь PDF, задаёшь вопрос — получаешь ответ
from openai import OpenAI
import pdfplumber
# 1. Извлекаем текст из 200-страничного договора
with pdfplumber.open("contract.pdf") as pdf:
contract = "\\n".join(p.extract_text() for p in pdf.pages)
# 2. Спрашиваем модель — весь документ в одном промпте
client = OpenAI(base_url="https://api.42gpu.ru/v1", api_key="sk-...")
response = client.chat.completions.create(
model="local/qwen3.5-397b",
messages=[{
"role": "user",
"content": f"Договор:\\n{contract}\\n\\nНайди условия о штрафах и расторжении."
}],
)
print(response.choices[0].message.content)Если документ дробный — например, набор PDF — каждый по отдельности извлекается в текст и склеивается в один промпт. До 750 страниц A4 умещается без потерь.
Вопросы про обработку документов
Попробуйте на своём документе
Welcome-кредит 1 000 ₽ хватит на десятки длинных документов. Email + пароль — и работаете.
- 1M контекста
- Данные в РФ
- OpenAI SDK работает