Dropbox включает в себя поиск текста в PDF документах и изображениях
Оглавление:
Второй раз всего за два месяца Dropbox усовершенствовал свою поисковую систему, чтобы теперь он мог искать текст в документах PDF и даже в файлах изображений, таких как PNG или JPG.
Dropbox: найдите то, что вы хотите, где вы хотите
Похоже, что это предпосылка Dropbox, популярной облачной платформы хранения, которая в последние месяцы сосредоточилась на улучшении своей поисковой системы. В прошлом месяце компания развернула новую поисковую систему, основанную на машинном обучении, и в настоящее время объявляет, что она улучшает возможности оптического распознавания символов (OCR), которые позволяют пользователям выполнять поиск текста как в файлах PDF, так и в файлах изображений.
«Форматы изображений (такие как JPEG, PNG или GIF), как правило, не индексируются, поскольку они не имеют текстового содержимого, в то время как текстовые форматы документов (такие как TXT, DOCX или HTML), как правило, индексируются. Файлы PDF остаются посередине, поскольку они могут содержать смесь текста и изображения. Автоматическое распознавание текста изображения позволяет разумно различать все эти документы для классификации данных, которые оно содержит.
Несмотря на хорошие новости, на данный момент это новое улучшение ограничено в двух аспектах. С одной стороны, кажется, ограничивается английским языком:
Поэтому теперь, когда пользователь выполняет поиск на английском языке, который появляется в одном из этих файлов, он будет отображаться в результатах поиска.
С другой стороны, как собирает Джон Портер в The Verge, функция ограничена самыми дорогими уровнями подписки.
Новая функция теперь доступна для пользователей Dropbox Business Advanced и Enterprise, и должна быть доступна для профессиональных подписчиков Dropbox в ближайшие месяцы.
Эта операция аналогична технологии, уже реализованной в мобильном приложении Dropbox в прошлом году: она используется для фотографирования документа, но одновременно запускается OCR для извлечения текста. Однако это работало только с небольшим подмножеством документов.
Благодаря внедрению возможностей оптического распознавания текста непосредственно в поисковой системе, Dropbox теперь может искать текст во всех ваших PDF-файлах и изображениях, независимо от того, как они были отсканированы или сфотографированы.
DropboxThe Verge FontWindows phone 8.1 gdr2 включает в себя противоугонную систему
Microsoft недавно анонсировала новые Lumia 640 и XL, предназначенные для промежуточного сегмента и имеющие Windows Phone GDR2 8.1.
Программное обеспечение Radeon 16.10.1, которое включает в себя асинхронный SpaceWarp
AMD выпустила свои новые графические драйверы Radeon Software 16.10.1 WHQL, представляющие новую технологию Oculus Asynchronous Spacewarp.
Ryzen Threadripper включает в себя набор удержания asetek
AMD Ryzen Threadripper будет поставляться с удерживающим комплектом Asetek, который позволит использовать большое количество жидкостных систем охлаждения.