Ручне сортування документів не потрібне
Що робить
Автоматизація Розкладка документів вирішує два пов'язані завдання: розпізнає тип файлу та надсилає його у правильне місце файлового сховища. AI-агент запускається на кожен новий документ, який потрапляє у вхідну папку або надходить вкладенням у пошту. Робота йде цілодобово, без ручного тригера.
Що робить AI-агент
- Отримує файл із вхідної папки файлового сховища або поштової скриньки — тригер спрацьовує на подію «новий файл».
- Витягує текстовий шар: OCR для сканів і фотографій, парсинг для PDF і DOCX, текст як є для TXT, RTF, EML.
- Класифікує документ за типом через LLM — договір, рахунок, акт звірки, кадровий документ, комерційна пропозиція, резюме, виписка з банку, довіреність.
- Витягує ключові метадані під тип документа: контрагент, дата, номер, сума для фінансових; ПІБ, посада, тип довідки для кадрових.
- Формує зрозуміле ім'я файлу за шаблоном — наприклад, «2026-04-24_Договор_ООО-Ромашка_№142.pdf» або «2026-04-24_Счёт_Контур_№СФ-00128.pdf».
- Переміщує файл у цільову папку за правилами, заданими при налаштуванні: /Договоры/2026/Действующие/, /Счета/Входящие/, /Кадры/Документы-сотрудников/Иванов-И-И/.
- Записує подію до логу: хто ініціатор, який тип розпізнано, з якою впевненістю, куди перенесено, timestamp для аудиту.
- Повідомляє відповідального менеджера при низькій впевненості розпізнавання або коли тип документа не потрапив у жодну з категорій — файл іде до папки «На розбір».
Чого автоматизація не робить
- Не приймає юридичних або фінансових рішень щодо змісту — лише класифікує та розкладає, не підписує, не погоджує, не схвалює платіж.
- Не перевіряє коректність реквізитів у документі: наявність підпису, печатки, відповідність шаблону. Це залишається роботою бухгалтера, юриста або відділу якості.
- Не замінює бізнес-процес погодження вхідного документа. Якщо договір має пройти через юриста та фінансового директора, маршрут погодження живе в окремій системі, а Розкладка лише забезпечує, що документ лежить там, де його знайдуть.
Як працює
Розкладка документів будується на зв'язці трьох шарів: тригер на файлове сховище, обробка файлу через LLM-агент, запис результату назад у сховище. Low-code стек дозволяє зібрати пайплайн за кілька днів без написання окремого backend-сервісу.
Технічний потік
- Тригер у low-code платформі або Zapier слухає вхідну папку в Google Drive, Dropbox, OneDrive або S3. При появі нового файлу передає його вміст у наступний крок.
- Крок вилучення тексту: для PDF використовується text extraction, для сканів — OCR (Tesseract, Google Vision, AWS Textract), для офісних форматів — парсери DOCX та XLSX.
- Крок класифікації: текст файлу передається в AI-модель з промптом, що описує типи документів компанії та очікувану JSON-відповідь виду {type, confidence, metadata}.
- Крок валідації: якщо confidence нижче заданого порогу, файл іде до папки «На розбір» і створюється завдання в Slack або Notion.
- Крок іменування: на основі вилучених метаданих формується нова назва файлу за шаблоном, заданим бізнесом.
- Крок переміщення: файл копіюється до цільової папки, оригінал видаляється або переноситься до архіву «оброблено».
- Крок логування: запис до таблиці Airtable, Google Sheets або Notion для аудиту — дата, тип, контрагент, шлях, confidence.
Етапи впровадження
- Тиждень 1 — дискавері. Збираємо список типів документів компанії, поточну структуру папок, правила іменування, поточних відповідальних. Фіксуємо ключові типи, що охоплюють основну масу вхідного потоку.
- Тиждень 2 — прототип. Розгортаємо оркестратор, підключаємо файлове сховище, пишемо промпт для класифікації, тестуємо на репрезентативній вибірці реальних документів.
- Тиждень 3 — налаштування правил. Допрацьовуємо шаблони назв, маппінг «тип → папка», пороги confidence, обробку винятків (нерозпізнані документи, дублікати, порожні файли).
- Тиждень 4 — пілот і запуск. Запускаємо на живий потік із паралельним ручним контролем у перші дні, фіксуємо розбіжності, ітеруємо промпт.
Компоненти рішення
Шар | Інструмент | Завдання |
|---|---|---|
Оркестрація | low-code платформа або Zapier | Тригер і пайплайн кроків |
Сховище | Google Drive, Dropbox, OneDrive, S3 | Джерело та цільове місце |
OCR | Google Vision, AWS Textract, Tesseract | Текст зі сканів та фото |
LLM | мовна модель | Класифікація та вилучення метаданих |
Лог | Airtable, Google Sheets, Notion | Аудит і звітність |
Сповіщення | Slack, email | Ескалація нерозпізнаних файлів |
Після стабілізації пайплайну рішення працює у фоновому режимі, потребує періодичної перевірки логу на дрифт якості — коли з'являється новий тип документа або контрагент змінює формат.
Що потрібно
Перед запуском Розкладки документів потрібно підготувати три шари: дані, доступи та людей. Без одного з них пілот буксує.
Дані та доступи
- Файлове сховище з API — Google Drive, Dropbox, OneDrive або S3-сумісне. Доступ на читання та запис до відповідних папок.
- Вхідна папка, до якої потрапляють файли — або вручну від менеджерів, або через інтеграцію з поштою, або вивантаженням з інших систем.
- Список типів документів, які реально зустрічаються у потоці, і правил їх зберігання — навіть якщо це зараз живе в голові офіс-менеджера.
- Зразки для кожного типу — кілька реальних файлів, щоб налаштувати класифікатор і перевірити якість на етапі прототипу.
- API-ключ до LLM-провайдера (Anthropic для AI-моделі) та до OCR-сервісу, якщо у потоці є скани.
- Акаунт workflow-рушія (self-hosted або cloud) або Zapier з достатнім лімітом операцій під очікуваний місячний обсяг.
Готовність команди
- Власник процесу — офіс-менеджер, керівник операцій або юрист, який вирішує, що вважати коректною розкладкою.
- Інженер або інтегратор, який зберне пайплайн у workflow-рушії та напише промпти — достатньо одного спеціаліста рівня middle.
- Згода користувачів на зміну шляху файлів. Якщо команда звикла складати документи вручну, важливо домовитися про нову структуру до запуску, а не після.
Таймлайн
- Формат weekend-проєкту: 2-4 тижні від старту до продакшену при одному інженері на частковому завантаженні.
- Перший тиждень — дискавері та збір зразків, другий — прототип, третій — налаштування та тести, четвертий — пілот і запуск з паралельним ручним контролем.
Болі
- Хаос у документах
- Повторювані рутинні завдання
FAQ
Скільки часу займає впровадження?
Розкладка документів запускається за 2-4 тижні. Перший тиждень іде на збір типів документів і зразків, другий — на прототип в оркестраторі, третій — на налаштування правил і тести на реальній вибірці, четвертий — на пілотний запуск із паралельним ручним контролем. Один інженер на частковому завантаженні справляється без залучення зовнішньої команди.
Що робити, якщо у нас немає єдиного файлового сховища з API?
Якщо вхідні документи зараз лежать у пошті або на локальному диску без єдиної точки входу, перед запуском Розкладки потрібно вибрати файлове сховище — підійде Google Drive, Dropbox, OneDrive або S3. Міграція старих файлів необов'язкова: автоматизація працює лише з новим потоком, а наявний архів залишається на своїх місцях до окремого проєкту перенесення.
Які ризики в автоматичної розкладки і що ламається?
Головний ризик — хибна класифікація рідкісних або нестандартних документів. Для таких випадків пайплайн надсилає файл до папки «На розбір» і сповіщає відповідального, не викидає і не губить. Другий ризик — зміна форматів від контрагентів; це вирішується моніторингом confidence і оновленням промпту. Втрати даних виключено: оригінал зберігається до підтвердження успішної розкладки.
Чи підходить рішення для нашої галузі?
Розкладка документів працює універсально — скрізь, де є вхідний потік файлів змішаних типів. Прямі кейси: юридичні фірми (договори, довіреності, судові акти), консалтинг (контракти, звіти клієнтів, НДА), професійні сервіси та агентства (ТЗ, акти, рахунки). Для галузей зі специфічними документами — медицина, логістика, нерухомість — під типи налаштовується окремий промпт.
Наскільки точно AI класифікує документи?
Якість класифікації залежить від вибірки на етапі налаштування. На типових класах документів при підготовленому промпті AI-модель показує стабільну якість на більшості стандартних форм. Файли з низькою впевненістю йдуть на ручний розбір — хибної розкладки мовчки не відбувається. Після першого місяця роботи промпт доопрацьовується за фактичними помилками, і точність зростає.
Чи працює це зі сканами та фотографіями документів?
Так, скановані документи та фото договорів обробляються через OCR-шар — Google Vision, AWS Textract або Tesseract для self-hosted рішень. Якість залежить від роздільної здатності та читабельності скана; для погано читаємих файлів агент одразу надсилає їх до папки «На розбір». Правило просте: документ, який людина не може прочитати, AI також не класифікує.
Хочете таку автоматизацію в своєму бізнесі?
Запишемо безкоштовний аудит — покажемо, як це працюватиме саме для вас.