Microsoft Office SharePoint Server

Пошук документів у графічних форматах в Microsoft Office SharePoint Server

Оперативний доступ до інформації давно став актуальною проблемою для багатьох організацій. Найчастіше пошук документа займає у співробітників занадто багато часу, що негативно позначається на роботі. Microsoft Office SharePoint Server пропонує потужний пошуковий сервіс, який дозволяє швидко і гарантовано знаходити електронні документи в бібліотеках SharePoint або на інших ресурсах корпоративної мережі.

Однак не всі документи зберігаються у форматі, придатному для повнотекстового індексування та пошуку. Безліч файлів залишається в сховищах у вигляді зображень, і пошук по їхньому вмісту неможливий. Приклади тому – факси, відскановані копії договорів, архіви газет і журналів, вхідна кореспонденція. Для здійснення пошуку по графічним образам документів необхідно спочатку вилучити їхній вміст за допомогою технології оптичного розпізнавання символів (OCR). Цю задачу ідеально вирішує ABBYY Recognition Server.

ABBYY Recognition Server представляє собою єдине серверне рішення для розпізнавання та конвертації документів. При роботі з Microsoft Office SharePoint Server ABBYY Recognition Server здійснює функціонал розпізнавання і дозволяє індексувати текст відсканованих або надісланих факсом документів. Тепер для індексування доступні документи у форматах TIFF, JPEG, PDF, DjVu тощо. В основі ABBYY Recognition Server лежить потужна технологія обробки документів на понад 190 мовах.

До складу ABBYY Recognition Server входить готовий IFilter для інтеграції з пошуковими системами Microsoft. Завдяки IFilter пошуковий сервіс Microsoft може задіяти ABBYY Recognition Server для вилучення вмісту з файлів графічних форматів. Тепер для повнотекстового індексування доступні документи у форматах TIFF, JPEG, PDF, DjVu та ін.

Схема роботи Microsoft Office SharePoint Server та ABBYY Recognition Server:

ABBYY Recognition Server и Microsoft Office SharePoint Server

  1. Пошуковий агент Microsoft Office SharePoint Server періодично обходить корпоративні бібліотеки та автоматично індексує нові або нещодавно змінені документи. Графічні документи, вміст яких немає можливості проіндексувати, через IFilter направляються на обробку в ABBYY Recognition Server.
  2. ABBYY Recognition Server розпізнає документи і повертає розпізнаний текст у Microsoft Office SharePoint Server для індексування. В результаті документи стають доступними для повнотекстового пошуку.

Інтеграція з Microsoft Windows Search

Пошук відсканованих документів на персональних комп'ютерах для всіх співробітників організації

ABBYY Recognition Server підтримує інтеграцію не тільки з Microsoft Office SharePoint Server, а й з Microsoft Windows Search. Один ABBYY Recognition Server, встановлений в корпоративній мережі, дає можливість всім співробітникам організації здійснювати повнотекстовий пошук документів, збережених на їхніх персональних комп'ютерах у вигляді зображень. Факси, брошури, книги, інструкції – будь-яка відсканована документація тепер може бути проіндексована за допомогою Windows Search.

При цьому ресурсномісткий процес розпізнавання виконується на сервері. На комп'ютери співробітників не потрібно встановлювати OCR-модуль – там працює тільки ABBYY Recognition Server IFilter – легкий плагін до Windows Search.

Схема роботи Windows Search та ABBYY Recognition Server:

ABBYY Recognition Server и Microsoft Office SharePoint Server

Windows Search автоматично обходить зазначені в його настройках ресурси на комп'ютері користувача. Текстові файли він індексує самостійно, а для отримання даних із файлів зображень задіює ABBYY Recognition Server IFilter. IFilter передає зображення на сервер ABBYY Recognition Server, встановлений у корпоративній мережі.

ABBYY Recognition Server розпізнає документи і відправляє результати в Windows Search для індексування, після чого документи стають доступними для повнотекстового пошуку.

Введення документів у бібліотеки Microsoft Office SharePoint Server

Крім вирішення задач повнотекстового пошуку по зображеннях, ABBYY надає зручні та прості в експлуатації рішення для введення паперових документів і даних у бібліотеки Microsoft Office SharePoint Server.

ABBYY Recognition Server надає функціональність для потокового введення документів, а також для сортування та атрибутування документів в режимі «канцелярії».

ABBYY FlexiCapture – потужна система, яка дозволяє організувати «єдину точку входу» для всіх паперових документів компанії. Продукт підтримує потокове і розподілене сканування і виконує повністю автоматичну класифікацію документів і вилучення даних з них.

ABBYY Recognition Server и Microsoft Office SharePoint Server

Розробка замовленого рішення з введення документів і даних

Замовлене рішення з розпізнавання та конвертації документів і вилученню даних для Microsoft Office SharePoint Server можна розробити з використанням інструментів для розробників ABBYY FineReader Engine та ABBYY FlexiCapture Engine. Вони дозволяють вбудувати технології повнотекстового розпізнавання (ABBYY FineReader Engine) і технології класифікації документів і вилучення даних (ABBYY FlexiCapture Engine) всередину SharePoint Server і створити інтерфейс управління, найбільш зручний для задач клієнта.