Google 图书如何运作?有没有开源替代方案?

发布于 2024-08-06 19:30:37 字数 221 浏览 13 评论 0原文

有人要求我像 Google 图书那样在线出版一本完整的图书吗?即它是可查看和可打印的,但不可下载。

该过程基本上是“高质量扫描”吗?是否有任何开源解决方案可以在这些高质量图像上“批量生成”“水印”。假设您有原始图像。当用户在线查看它时,我重新创建图像,添加水印和图像顶部的一些其他文本“即时”,Python中是否存在这样的库:)

有什么提示吗?如果您以前做过此操作,请分享。

谢谢

I have been asked to publish a complete book online similar way Google Books does? i.e. it's viewable and printable but not download-able.

Is the process is basically "high quality scanning"? are there any open source solution to "mass generation" of "watermark" on those high quality images. Suppose you have an original image. and when the user views it online, I re-create the image add watermark and some other text on top of the image "on-the-fly" are there such library exist in python off course :)

Any tips? If you have done this before please share.

Thanks

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

牵你的手,一向走下去 2024-08-13 19:30:37

不幸的是,谷歌使用专利技术来扫描其书籍,因此您可能必须坚持使用传统方法。

Google 创造了一些非常漂亮的东西
红外摄像头技术
检测三维形状
以及书籍时书页的角度
被放置在扫描仪中。这
信息传输至 OCR
软件,它可以调整
扭曲并允许 OCR
更准确地阅读文本的软件。
不再有破损的绑定,不再有
玻璃板效率低下。

基本上,您需要使用 OCR 应用程序扫描这本书(tesseract 很好),然后我会从扫描的文本生成 PDF/图像,最后在顶部添加水印。 Python 成像库 似乎是最好的工具。

Unfortunately Google uses a patented technique for scanning it's books, so you will probably have to stick to traditional methods.

Google created some seriously nifty
infrared camera technology that
detects the three-dimensional shape
and angle of book pages when the book
is placed in the scanner. This
information is transmitted to the OCR
software, which adjusts for the
distortions and allows the OCR
software to read text more accurately.
No more broken bindings, no more
inefficient glass plates.

Basically you will need to scan the book using an OCR application (tesseract is good), then I would generate a PDF/image from the scanned text, and finally add the watermark on top. The Python Imaging Library would seem to be the best tool for this.

〃安静 2024-08-13 19:30:37

对 Google 图书了解不多,但 Python 图像库 可以做水印(有 < a href="http://code.activestate.com/recipes/362879/" rel="nofollow noreferrer">ASPN 配方)。

Don't know much about Google Books, but Python Imaging Library can do watermarking (there's ASPN recipe for that).

青春如此纠结 2024-08-13 19:30:37

请参阅 lashdot 关于复制 Google 照片 + 激光网格技术的问题。

See the slashdot question on reproducing Google's photo + laser grid technique.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文