Folium
Від паперових документів до електронних сховищ

Оцифрування паперових архівів документації, структурування і надання співробітникам оперативного доступу до архівних даних - актуальне завдання для різних компаній і організацій. Специфіка фінансової документації та використання новітніх технологій виокремлення та зберігання даних дозволяють перейти від паперових до електронних архівів сховищ за короткі терміни й з мінімальними витратами.

Сама по собі ідея оцифрування паперових оригіналів вже давно ні для кого не є новинкою. Інша справа, що традиційно цей процес вважається довгим і трудомістким. І, так чи інакше, сканування - це тільки перший крок до ефективного і зручного електронного сховища. Для подальшої роботи з отриманими електронними образами необхідно забезпечити кожен із документів певним набором метаданих (створити «картку документа»), - в подальшому це дозволить використовувати різні пошукові можливості та фільтри, створювати різне візуальне представлення і розмежовувати права доступу для користувачів. Окрім того, як правило, необхідно створити нове або доопрацювати наявне дерево рубрик і каталогів, що спрощують пошук необхідної інформації.

Загальні міркування
На сьогоднішній день на ринку [Росії - прим. ЕЛАУ] представлена ​​достатня кількість рішень, що забезпечують, тою чи іншою мірою, перерахований функціонал. Однак, як показує досвід, далеко не завжди користувачів задовольняє швидкість вилучення інформації з електронного сховища і надані можливості з адаптації системи і, зокрема, конфігурації набору метаданих, збережених за кожним документом, під потреби організації. Ще одна складність, з якою найчастіше зіштовхуються компанії під час  прийняття рішення про переведення архіву в електронний вигляд - це значні терміни та значні обсяги роботи співробітників-операторів, які забезпечують ручне введення інформації при оцифруванні паперового архіву. Побоювання про можливу низьку ефективність впровадженої системи і високі витрати на оцифрування, вочевидь, два ключових потенційних бар'єри, що обмежують впровадження систем електронного архіву, незважаючи на очевидні переваги роботи з електронними документами. Традиційно,  під час створення електронного сховища замовнику доводилося обирати з трьох параметрів (терміни введення в експлуатацію, швидкодію, гнучкість налаштувань) два найбільш важливих. Використання актуальних технологій вилучення та зберігання даних дозволяє уникнути подібного вибору.


Гнучкість або швидкість? З точки зору гнучкості для роботи з різними типами документів найбільш універсальним рішенням можна вважати зберігання електронних образів у файлових папках Windows. В цьому випадку практично ніяких налаштувань непотрібно, а пошук необхідної інформації може здійснюватися за допомогою повнотекстового пошуку засобами файлового сервера. Безумовно, це буде самий гнучкий, але також і найповільніший варіант. З точки зору швидкості найбільш виграшним варіантом є використання таблиць, збережених в реляційних базах даних. У цьому випадку показники швидкості будуть найбільш виграшними, проте всі параметри документів повинні бути описані на початковому етапі. Як відомо, істина завжди десь посередині, як правило, розробники систем електронного архіву передбачають певний набір найбільш використовуваних параметрів документів, використання яких може в певних межах змінюватися при налаштуванні, знаходячи певний компроміс між швидкістю і гнучкістю, можливостями пошуку за атрибутами документа і часом на введення архіву в експлуатацію.
Ідеальним з цієї точки зору можна вважати рішення, яке здійснює динамічне відображення об'єкта зберігання (структури даних, яка містить сам документ і необхідний набір атрибутів облікової картки) в таблицях реляційних баз даних. Таким чином, забезпечується одночасно і універсальність рішення для роботи з різними видами інформації та висока продуктивність, забезпечувана використанням ефективної СУБД.
Зображення або текст? Ще одне питання, як правило, виникає при створенні електронного архіву. У разі якщо електронні образи являють собою графічні файли, неможливий пошук по тексту документа, проте розпізнавання великих обсягів тексту, навіть з використанням різних рішень для потокового вводу інформації, як правило, займає істотне час і вимагає істотних трудовитрат. Тут, як правило, проміжний варіант виглядає так - з документа витягується деякий значимий набір атрибутів, за якими, як правило, і здійснюється пошук, а електронний образ документа зберігається в графічному вигляді. З появою технології, що забезпечує вилучення необхідної інформації з неструктурованого документа, переваги такого підходу стали ще більш наочними.

Практичний досвід
Для наочної демонстрації нових можливостей добре підходить один з проектів, виконаний з використанням нашого продукту eDocLIb: «Зберігання та оцифровка» в інвестиційній компанії, що спеціалізується на вексельних програмах та операціях на борговому ринку. У компанії існує величезний архів фінансової документації - різних договорів, векселів, заяв, звітів і т.п. в паперовому вигляді. Тривалість пошуку необхідного документа, не кажучи вже про більш складні дії, скажімо, вибірці договорів, за якими була проведена оплата, в певний період починала надавати все більший вплив на ефективність ключових бізнес-процесів.
Було прийнято рішення про необхідність організації електронного архіву та впровадження ІТ-системи, що дозволяє оперативно забезпечувати співробітників наочним представленням інформації. Враховуючи значний обсяг різноманітної паперової документації, були сформульовані наступні вимоги до вирішення:
• Мінімальні терміни переведення існуючих документів в електронний вигляд
• Простий і ефективний алгоритм завантаження знову надходять документів в систему
• Простота використання системи для кінцевих користувачів
• Мінімальні терміни введення рішення в промислову експлуатацію
• Можливість самостійного обслуговування і доопрацювання рішення фахівцями замовника

Особливості рішення
З фінансових документів, що містяться в архіві, як правило, вдавалося досить просто виділити певний набір значущих параметрів, таких як дата, сума, номер і т.п. При цьому значна частина тексту в документі є набір стандартних загальноприйнятих формулювань. Відповідно, і ймовірність використання в повсякденній роботі повнотекстового пошуку по документу невелика. Таким чином, було прийнято рішення про зберігання електронних образів у графічному форматі і недоцільність розпізнавання всього тексту, а значить, істотно зменшено час перекладу архіву в електронний вигляд. Залишалося виділити значущі атрибути, які будуть затребувані для пошуку необхідного документа, або для підготовки зведеної аналітичної довідки.
Після визначення набору параметрів для кожного з типів документів була проведена необхідна настройка рішення для вилучення відповідного набору елементів при скануванні. В результаті процедура завантаження документа в архівну систему виглядає наступним чином - сканований документ обробляється за допомогою технології ABBYY FlexiCapture, отриманий набір даних вивантажується в форматі XML і передається модулю експорту-імпорту даних системи eDocLib. Надалі архівна система на платформі eDocLib, легко адаптується під будь-який набір атрибутів документа, забезпечує обробку інформації, включаючи відображення в різних форматах, рубрикацію і різні пошукові можливості. Зберігання отриманої інформації у вигляді таблиць реляційної БД припускає високу швидкість обробки пошукових запитів і отримання необхідної інформації. В результаті, забезпечений швидкий доступ до всієї необхідної інформації в різних уявленнях, мінімізовано час на запуск електронного архіву в роботу і забезпечена можливість надалі розширювати набір збережених в системі документів та атрибутів облікових карток документів, в тому числі власними силами фахівців замовника.

Результат
Використання комплексного рішення eDocLib: «Зберігання та оцифровка» дозволило значно прискорити процес завантаження в електронний архів накопиченої паперової документації та обробки знову надходять документів. Застосування платформи eDocLib дозволило забезпечити збереження даних, швидкий пошук необхідної інформації та її відображення в найбільш зручному вигляді для різних груп користувачів. Впровадження системи значно скоротило час, що витрачається співробітниками на пошук необхідної інформації за договорами, векселями, актів та інших фінансових документів. Особливістю реалізованого рішення є можливість його подальшої адаптації для роботи з новими типами документів фахівцями замовника без залучення розробників або зовнішніх ІТ-фахівців. Гнучкість налаштування забезпечується використанням платформи eDocLib, що включає в себе засіб для об'єктно-реляційного відображення структури даних для кожного з типів документів в СУБД. Таким чином, всякий раз, коли систему необхідно переналаштувати для роботи з новим набором атрибутів документа, достатньо внести зміни в існуючу конфігурацію за допомогою наочного візуального конструктора.
В результаті впровадження замовник в повній відповідності зі своїми побажаннями в мінімальні терміни отримав систему, що забезпечує співробітникам швидкий і зручний доступ до необхідної інформації.


Сергій Полтев
Джерело: bankir.ru

Ключові слова : ,