Google 图书扫描大揭秘:革命性的扫描技术!

Google 在线图书馆以不断增加的海量般的藏书量,以免费方便简洁的阅读方式,在世界范围内广受欢迎。不过本文并非告诉你如何下载 Google 图书,而是简明扼要地告诉你 Google 是如何把这些海量图书扫描进去的,因为在此之前伟大的 Google 同志一直对此商业机密讳莫如深。

NPR 04月30日报道,在Google出现之前,图书扫描是一个繁杂的过程,有时还会将书破坏掉。过去用来扫描图书的软件叫做光学文字识别(Optical Character Recognition,简称 OCR),它要求图书的每一页都需要平铺展开。现在任何曾经打开过一本书的人都知道,不用别的什么东西就能把书平铺展开是不可能的。一种方法是把书的每一页都平铺在玻璃板上,不过这种方法效率太低。另外一种方法是解开装订的图书,但是这又会破坏整本书。如何才能快速、高效地扫描图书而又不对其造成损害?只有Google提出了解决图书扫描的这个难题。

原来,Google 发明了一种非常精巧的红外摄像技术,用来查看放在扫描仪上的书的三维图像及其角度,之后将该信息传给 OCR 软件以矫正错误,从而更精确地识别出文本。这种方法既不会破坏图书的装订,也避免了把书放在玻璃板上平铺的低效。Google 最终想出了将大量图书进行数字化的方法。另据 NewScientist 04月04日的报道,Google 这项革命性的图书扫描技术已经获得了专利(专利号为 US 7508978)。

编后语:Google 不用逐页展开图书页面即可高速精确地将文本进行扫描,这项技术是对传统扫描技术的颠覆性革新。这为其庞大的全球图书数字化工程提供了有力的技术保证。我们乐见这项技术的推广和应用,因为我们从中能够获得高科技带来的全新的享受!

【本文正文部分翻译自 NPR  和 NewScientist 。版权所有,转载请注明出处】

2009-05-09 @ 09:54:05 | 分类: 网络 | Internet | 标签: , , | 阅读: 11,359 次 | 评论: 4

相关文章阅读

本文已有 4 位高人指点~~

  • Fengshen @ 2009.05.09 12:36

    谷歌真是越来越能zuo了!

    • 365hope @ 2009.05.09 13:15

      我极为看好伟大的 Google 同志!呵呵~~~

      • Sayou @ 2009.05.09 18:46

        Google是个很年轻的公司,可发展势头太猛了!几乎每天都在使用它的产品。

        • 365hope @ 2009.05.10 09:09

          在信息时代,没有先例可循,唯有技术。Google已经渗入我每天的生活、学习和工作。

          .

          (必填)
          (必填,但绝不会公开)