2009年5月5日星期二

谷歌推出图书扫描机[转自安顺晚报]

  可将图书批量数字化
  谷歌对于图书扫描一直非常重视。多年以来,这个问题也引起了作家和出版商的许多争议。在最近谷歌同美国作家协会(Authors Guild)所达成的和解协议里,谷歌就曾计划扫描数千万本书籍,并试图尽可能地将这些内容实现数字化。
  谷歌高度重视获取书籍里保存的内容和知识,并准备提供有关的搜索索引,这也推动谷歌在2009年3月24日发布了一项专利,以便以更快的速度实现图书扫描。
  据了解,这个图书扫描机使用了两个红外摄像头(infrared cameras)。这两个摄像头可以探测要扫描的每篇书页,确定其是平直还是弯曲,然后可以将这一信息传输至OCR软件,并进行失真校准。换句话说,红外摄像头可以确定扫描书籍的三维形态,然后进行任何相应的调整。由于这种技术既不会破坏图书装订,也不用把图书一页页打开平铺在扫描板上进行扫描,所以能够更快地进行图书扫描。因此,可以说谷歌找到了对图书批量数字化的方法。
  除了谷歌的图书扫描项目之外,还有一些其它的图书扫描计划。例如互联网档案馆计划(Internet Archive)在全球启动了18个扫描中心,平均每天总共能够扫描1000本书,但并不清楚互联网图书馆计划使用的是哪种扫描技术,有可能谷歌使用的扫描技术会更快一些。

没有评论: