Новости

Dropbox включает в себя поиск текста в PDF документах и ​​изображениях

Оглавление:

Anonim

Второй раз всего за два месяца Dropbox усовершенствовал свою поисковую систему, чтобы теперь он мог искать текст в документах PDF и даже в файлах изображений, таких как PNG или JPG.

Dropbox: найдите то, что вы хотите, где вы хотите

Похоже, что это предпосылка Dropbox, популярной облачной платформы хранения, которая в последние месяцы сосредоточилась на улучшении своей поисковой системы. В прошлом месяце компания развернула новую поисковую систему, основанную на машинном обучении, и в настоящее время объявляет, что она улучшает возможности оптического распознавания символов (OCR), которые позволяют пользователям выполнять поиск текста как в файлах PDF, так и в файлах изображений.

«Форматы изображений (такие как JPEG, PNG или GIF), как правило, не индексируются, поскольку они не имеют текстового содержимого, в то время как текстовые форматы документов (такие как TXT, DOCX или HTML), как правило, индексируются. Файлы PDF остаются посередине, поскольку они могут содержать смесь текста и изображения. Автоматическое распознавание текста изображения позволяет разумно различать все эти документы для классификации данных, которые оно содержит.

Несмотря на хорошие новости, на данный момент это новое улучшение ограничено в двух аспектах. С одной стороны, кажется, ограничивается английским языком:

Поэтому теперь, когда пользователь выполняет поиск на английском языке, который появляется в одном из этих файлов, он будет отображаться в результатах поиска.

С другой стороны, как собирает Джон Портер в The Verge, функция ограничена самыми дорогими уровнями подписки.

Новая функция теперь доступна для пользователей Dropbox Business Advanced и Enterprise, и должна быть доступна для профессиональных подписчиков Dropbox в ближайшие месяцы.

Эта операция аналогична технологии, уже реализованной в мобильном приложении Dropbox в прошлом году: она используется для фотографирования документа, но одновременно запускается OCR для извлечения текста. Однако это работало только с небольшим подмножеством документов.

Благодаря внедрению возможностей оптического распознавания текста непосредственно в поисковой системе, Dropbox теперь может искать текст во всех ваших PDF-файлах и изображениях, независимо от того, как они были отсканированы или сфотографированы.

DropboxThe Verge Font

Новости

Выбор редактора

Back to top button