ABBYY Recognition Server и Google Search Appliance

Оперативный поиск нужной информации в считанные секунды давно стал актуальной проблемой для многих организаций. Зачастую поиск документа или данных занимает слишком много времени у сотрудников, что отрицательно сказывается на работе в целом. Быстрый поиск документов в рамках предприятия может быть осуществлен благодаря специальным поисковым серверам, которые индексируют документы внутри организации. Пример тому – поисковый сервер Google Search Appliance (GSA).

 

ABBYY Recognition Server и Google Search Appliance

Google Search Appliance (GSA) представляет собой специализированное сетевое устройство, предназначенное для решения проблемы поиска информации во внутренней сети предприятия. Google Search Appliance автоматически индексирует документы в корпоративной системе для осуществления поиска. Google Search Appliance позволяет вести поиск по более 200 форматам документов, среди которых HTML, DOC, XLS, TXT и другие.

Однако не все документы хранятся в подходящем для индексирования формате. Множество документов хранится в виде графических изображений, поиск по содержимому которых невозможен. Примерами таких документов могут быть факсы, копии отсканированных договоров, презентации и другие документы. Для осуществления поиска по графическим образам документов, прежде всего необходимо перевести их в текстовый формат для возможности индексирования. Самым удобным способом для этого является интеграция системы распознавания в работу поискового сервера.

ABBYY Recognition Server представляет собой единое серверное решение для распознавания и конвертации документов. При работе с Google Search Appliance ABBYY Recognition Server осуществляет функционал распознавания и позволяет индексировать текст отсканированных или присланных по факсу документов. Теперь для индексирования доступны документы в форматах TIFF, JPEG, PDF, DjVu и т.п. В основе ABBYY Recognition Server лежит мощная технология обработки документов на более 190 языках.

Схема работы Google Search Appliance и ABBYY Recognition Server:

  1. Google Search Appliance автоматически индексирует документы в корпоративной системе. Если в систему поступают документы в графических форматах, которых нет возможности проиндексировать, то такие документы направляются на обработку в ABBYY Recognition Server.
  2. ABBYY Recognition Server распознает документы и отправляет результаты в виде XML-фида в Google Search Appliance для индексирования, после чего данные документы становятся доступны для поиска.
ABBYY Secognition Server и Google Search Appliance

Преимущества совместного решения:

  1. Ни один документ не останется ненайденным. Совместное решение Google Search Appliance и ABBYY Recognition Server позволяют вести поиск по более чем 200 форматов файлов, в том числе TIFF, JPEG, PDF, DjVu и другим.
  2. Готовое к использованию решение. Не нужно вручную сортировать документы и отправлять на графические документы на предварительную обработку. Совместное решение Google Search Appliance и ABBYY Recognition Server позволяет автоматически обрабатывать графические документы до их индексирования в системе.
  3. Масштабируемость. ABBYY Recognition Server может быть установлен на отдельном компьютере в корпоративной сети, при этом обработка документов может производиться одновременно на нескольких процессорах, что быстро и легко производить обработку документов.