AI-розділення, пошук та резюме документів: як ці функції змінюють роботу з документами

За даними McKinsey Global Institute, працівники в середньому витрачають 1,8 години на день, тобто близько 19% робочого часу, на пошук інформації. У командах, які щодня працюють із сотнями документів, на цю рутину додається ще ручне розділення пакетів файлів і прочитання довгих контрактів. У статті розбираємо три AI-функції Scriptum.DMS, які забирають цей час на себе: AI-розділення, пошук і резюме.

Як ці три функції утворюють один ланцюжок

Розділення, пошук і резюме – це послідовні етапи, які проходить документ у системі документообігу. Кожен з них вирішує свою задачу і має сенс окремо, але разом вони стають end-to-end процесом без участі людини.

Логіка проста:

  1. На вхід у систему часто потрапляє один файл, який містить кілька різних документів. AI-розділення відокремлює їх.
  2. В архіві з тисячами документів треба знайти потрібний за змістом, а не за назвою. Цю задачу вирішує AI-пошук.
  3. Знайдений документ часто довгий і написаний складною мовою. AI-резюме виокремлює суть.

AI-розділення документів: коли один файл містить кілька

AI-розділення автоматично розпізнає межі між документами в одному PDF-файлі і виокремлює їх у окремі картки в системі. Вхідний пакет з договору, двох додатків і трьох рахунків стає шістьма самостійними одиницями обліку без ручної роботи оператора.

У реальному документообігу пакети документів – швидше норма, ніж виняток:

  • скани архівів, де старі справи зшиті по 100+ сторінок без розділювачів;
  • пошта зі вкладеннями, де контрагент відправив усі документи одним файлом;
  • сторонні системи, які експортують пакети у вигляді одного PDF.

Без AI-розділення оператор має відкрити кожен файл, прокрутити сторінки, зрозуміти межі документів, розрізати файл на частини і завантажити кожну окремо. Для пакету з 10 документів це може зайняти 20–30 хвилин на людину.

У Scriptum.DMS AI Розділення працює як перший крок обробки. Система отримує файл, аналізує структуру і візуальні ознаки кожної сторінки: заголовки, штампи, реквізити, типові шаблони. На основі цього вона визначає межі між різними документами в пакеті.

А якщо документи в пакеті дуже схожі за структурою?

AI враховує не лише візуальну структуру, але й семантику тексту: контрагентів, дати, типи документів. Якщо в пакеті є два схожих рахунки від одного постачальника, система розпізнає їх як два окремі документи за різними номерами і датами. У складних випадках спрацьовує механізм AI-оцінювання результатів, який передає файл на ручну перевірку оператору.

AI-розділення

AI-розділення у Scriptum.DMS

AI-пошук документів: як знайти потрібне у мільйонному архіві

AI-пошук шукає інформацію всередині тексту документів і за смислом, а не лише за назвою або метаданими. Ви можете знайти потрібний договір, навіть якщо не пам'ятаєте ні номер, ні назву файлу. Достатньо описати суть запиту своїми словами.

Що такий пошук знаходить:

  • усі договори з певним постачальником на суму понад визначену межу;
  • документи, в яких є конкретний пункт або умова (наприклад, «штрафи за прострочення понад 10 днів»);
  • згадування контрагента або проєкту в будь-якому місці тексту, включно зі сканованими додатками.

Чим AI-пошук кращий за класичний повнотекстовий пошук на Elasticsearch?

Повнотекстовий пошук шукає за збігом слів. Якщо ви вводите «штрафи», він знайде документи зі словом «штрафи», але пропустить ті, де написано «фінансові санкції» або «неустойка». AI-пошук розуміє синонімічні зв'язки і знаходить документи за смислом, а не за точним збігом тексту.

За прогнозом Gartner, ринок інтелектуальної обробки документів (IDP) сягне 2,09 млрд доларів до 2026 року з CAGR 13% від 2021 року. Технологія, яка ще кілька років тому виглядала як експериментальна, перетворюється на стандарт корпоративних систем.

AI-резюме документів: коли потрібна суть за 30 секунд

AI Резюме автоматично формує коротке смислове резюме документа, виокремлюючи ключові пункти: сторони, строки, фінансові умови, важливі застереження. Замість того, щоб читати договір на 25 сторінок, користувач отримує структуроване резюме за хвилину.

Кому це особливо корисно:

  • юристам, які щодня переглядають десятки контрактів і додаткових угод;
  • керівникам, які приймають рішення на основі довгих звітів і техдокументації;
  • бухгалтерам і фінансистам перед погодженням договорів з нетиповими умовами.

Сценарій з практики: керівник отримує запит від відділу закупівель погодити договір з новим постачальником. Замість того, щоб виділяти годину на читання, він відкриває картку в Scriptum.DMS і за пів хвилини бачить резюме. Якщо щось викликає питання, переходить до повного тексту за конкретним пунктом.

AI-резюме

AI-резюме у Scriptum.DMS

Що думає про це ринок

За оцінкою IDC, фокус галузі обробки документів змінився за останні кілька років.

«Виклики змістилися від обробки неструктурованих документів до видобування з них змістовних інсайтів незалежно від структури – та побудови end-to-end автоматизованих процесів, які живлять корпоративні системи надійними даними».

– Ендрю Генс, старший аналітик IDC з технологій комп'ютерного зору та AI

AI-резюме – саме той тип функції, який IDC називає «видобуванням інсайтів». Замість того щоб людина читала документ заради 5 ключових фактів, система робить це сама і повертає готову відповідь.

Як ці три функції працюють разом у Scriptum.DMS

Розділення, пошук і резюме найбільший ефект дають у комбінації, а не як окремі інструменти. End-to-end сценарій з реального документообігу:

  1. На корпоративну пошту прийшов PDF на 18 сторінок від нового постачальника – пакет з договору, двох додаткових угод і кошторису.
  2. Scriptum.DMS отримує файл і запускає AI-розділення. Через хвилину в системі вже 4 окремі картки документів з правильними типами і автоматично заповненими полями.
  3. Через місяць у бухгалтерії виникає питання: де було сказано про оплату у разі ранньої поставки? AI-пошук знаходить релевантний пункт за 5 секунд, навіть якщо він був у додатковій угоді, а не в основному договорі.
  4. Юрист, який має погодити чергову додаткову угоду з тим самим постачальником, відкриває AI Summary базового договору і за 30 секунд розуміє контекст.

AI-розпізнавання, пошук та резюме у Scriptum.DMS

Як ці функції реалізовані у Scriptum і Megapolis.DocNet

AI-функції InBase реалізовані в кількох продуктах з різною глибиною, залежно від того, які задачі вирішує конкретна система.

Scriptum – low-code платформа автоматизації процесів. AI-функції розділення і пошуку інтегруються як кроки workflow: документ, що проходить через бізнес-процес, може автоматично розділятися, класифікуватися, шукатися в архіві і запускати наступні етапи без участі людини.

Megapolis.DocNet – система корпоративного документообігу для великого бізнесу і держсектору. AI-можливості допомагають працювати з великими архівами на мільйони документів.

Якщо ви на етапі вибору системи і хочете подивитися, як ці три функції працюють на ваших документах, запишіться на персональне демо. Покажемо AI-розділення і AI-резюме на ваших реальних файлах та обговоримо, з якого сценарію впровадження найкраще почати.

Замовити демо

Поширені запитання

Чи можна довіряти результатам AI у розділенні і резюме?

У Scriptum.DMS вбудовано механізм AI-оцінювання результатів. Система перевіряє якість власної роботи і визначає рівень впевненості в результаті. Якщо впевненість недостатня, документ передається на ручну перевірку оператору. Так швидкість AI поєднується з людським контролем у критичних ситуаціях.

Скільки документів треба, щоб система навчилася?

Базові моделі вже навчені на великих обсягах даних і працюють з типовими корпоративними документами без додаткового навчання. Для специфічних типів документів (галузевих регламентів, нетипових форм) система може донавчатися на ваших прикладах. Зазвичай для цього достатньо 50–100 зразків.

Чим AI-розділення відрізняється від OCR і IDP?

OCR – це механічне зчитування тексту з зображення за координатами. IDP – це комплекс технологій: розпізнавання тексту, класифікація документів, витягування даних. AI-розділення (Splitting) – одна з функцій у межах IDP, яка вирішує конкретну задачу: відокремити різні документи в одному файлі. Детальніше про відмінності між OCR, IDP та AI-розпізнаванням – у статті Як AI розпізнає документи і допомагає автоматизувати роботу з ними.

Чи може AI-пошук пропустити документ, який точно є в архіві?

Так, як і будь-який алгоритм пошуку. Тому у Scriptum.DMS AI-пошук комбінується з класичним повнотекстовим пошуком і фільтрами за метаданими. Якщо AI не дає очікуваного результату, користувач може перейти до пошуку за атрибутами або структурою каталогів.

Чи можна почати лише з однієї функції?

Так. Кожна з трьох функцій працює самостійно. Більшість компаній починають з тієї задачі, де найбільше витрачається часу. Якщо у вас багато пакетних документів – пробуйте AI Splitting. Якщо багато довгих контрактів – AI Summary.

Висновок

Розділення, пошук і резюме на основі AI вирішують три різні задачі, але об'єднує їх одна мета – звільнити час команди для роботи, яка справді потребує людини. У великих архівах ці функції стають базовою інфраструктурою, без якої документообіг швидко перетворюється на пляшкове горлечко.

Це лише три з можливостей штучного інтелекту в роботі з документами. Якщо ви хочете побачити повну картину – як AI впливає на класифікацію, аналіз договорів, виявлення ризиків і автоматизацію бізнес-процесів – читайте статтю Як AI змінює роботу з документами у компаніях.

А якщо хочете подивитися, як ці три функції працюють на ваших документах, запишіться на демо Scriptum.DMS.

Замовити демо Scriptum.DMS

Джерела

Слідкуйте
за нашими новинами
та заходами
Підписатися