天下网吧 >> 网吧天地 >> 网吧行业 >> 网络追踪 >> 正文

谷歌文件新推OCR功能:图像和PDF可抓取文字

2010-6-22cnbeta佚名
     OCR(光学字符识别)粉丝们,如果你对现在使用的在线转换感到沮丧,现在福音降临了,谷歌文件现在可以从图像和PDF文件抓取文本,速度奇快而且免费。据谷歌操作系统的博客介绍,经过几个月的开发和实验,谷歌悄悄的推出这个新功能。但是它否会取代目前的商业软件或在线解决方案呢?

  上传文件到帐户时,用户将看到一个运行OCR扫描的选项,这个选项将提取文件中的字符置于一个新的文本文档中。至于准确性去,公平的说PDF比图片好的多,特别是白纸黑字的文件。

googleocr_jun10.jpg

  我上传了我的名片尝试,认识卡片上最大字体和清晰的文字是谷歌文档都有点问题,但令人惊讶的是小字体的文件反而效果更好。PDF文件测试的识别结果则近乎完美,但谷歌文件几乎去除了所有的格式(排版),只是简单的输出文本和空格。谷歌操作系统博客给的其他例子的效果不错,但还不够完善或好用。

  此外,扫描PDF时谷歌文档不保存PDF副本,所以扫描文本和原始文件需要单独的上传两次。对于偶然使用OCR的用户来说是一个很不错的功能,用户可以迅速从PDF,图像或名片中抓取文字。但对那些严重依赖OCR的用户可能会失望,可能使用商业软件的解决方案结果更好。

本文来源:cnbeta 作者:佚名

声明
声明:本站所发表的文章、评论及图片仅代表作者本人观点,与本站立场无关。文章是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 Email:support@txwb.com,系统开号,技术支持,服务联系微信:_WX_1_本站所有有注明来源为天下网吧或天下网吧论坛的原创作品,各位转载时请注明来源链接!
天下网吧·网吧天下
  • 本周热门
  • 本月热门
  • 阅读排行