Реальное Предотвращение Утечек Данных
 

Технологии оптического распознавания символов (OCR) для защиты от утечек данных

Использование в DeviceLock DLP технологии OCR позволяет распознавать и извлекать текст из отсканированных документов, сфотографированных (под углом 90 градусов к фотографируемой поверхности) документов, а также скриншотов документов и проверять его контентно-зависимыми правилами.

Оптическое распознавание символов (OCR) поддерживается для следующих языков: арабский, болгарский, каталонский, китайский упрощенный и традиционный, корейский, хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, венгерский, индонезийский, итальянский, латышский, литовский, норвежский, польский, португальский, румынский, русский, словацкий, словенский, испанский, шведский, турецкий и японский.

DeviceLock DLP извлекает текст для последующего анализа из графических изображений, встроенных (вложения) в сохраненные письма (EML), документы Adobe Portable Document Format (включая зашифрованные файлы) (PDF), Rich Text Format (RTF), AutoCAD (.dwg, .dxf) и Microsoft Office (.doc, .xls, .ppt, .vsd, .docx, .xlsx, .pptx, .vsdx) или из отдельных графических файлов. Всего поддерживается более 30 графических форматов: BMP, Dr. Halo CUT, DDS, EXR, Raw Fax G3, GIF, HDR, ICO, IFF (за исключением Maya IFF), JBIG, JNG, JPEG/JIF, JPEG-2000, JPEG-2000 codestream, KOALA, Kodak PhotoCD, MNG, PCX, PBM/PGM/PPM, PFM, PNG, Macintosh PICT, Photoshop PSD, RAW camera, Sun RAS, SGI, TARGA, TIFF, WBMP, XBM, XPM.

OCR имеет следующие возможности:

Помимо полноценного распознования текста также существует возможность быстрого обнаружения текста на изображении. Технология обнаружения текста на изображении делит графические файлы на две группы: изображения с текстом (например отсканированные документы или скриншоты документов) и изображения без текста, причем доступ к этим группам контролируется по отдельности. Например, можно разрешить определенным пользователям копирование на устройства изображений, не содержащих текст, но запретить им запись изображений, содержащих текст, и тем самым предотвратить утечку важной информации внутри графических файлов.

Основные функции и возможности DeviceLock Endpoint DLP Suite