读取 tif 文件格式时出现问题?
我有一个 *.tif
格式的图像文件,如下所示:
如您所见,它包含图像和大量文本。有什么方法可以读取我的 .tif
图像并将文本内容提取到 String 中?
I have an image file, in *.tif
format, that looks like this:
As you can see it contains an image along with a lot of text. Is there any way to read my .tif
image and extract the text content into a String ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
可以使用私有元数据标签在 TIFF 文件中嵌入文本,但通常不会这样做。图像中的文本很可能仅以图片/位图的形式出现,检索它的唯一方法是使用 OCR。
It's possible to embed text in a TIFF file using private metadata tags, but it's not usually done. Most likely the text in your image is present only as a picture/bitmap, and the only way to retrieve it is using OCR.
不,文件中的文本不是存储为文本,它基本上是文本的照片。您需要使用 OCR 或其他一些机器学习方法从图片中提取文本。
No, the text in the file is not stored as text, it's basically a photo of text. You need to use OCR or some other machine learning method to extract the text from the picture.