如何 OCR MODI.Document 的特定区域?
我需要对扫描文档的特定区域进行 OCR,并且我正在使用 MODI(Microsoft 的 Document Imaging COM 对象)。
我的代码目前 OCR 是整个页面(非常准确!),但我想定位页面的特定区域,其中文本始终是静态的(订单号)。我该怎么做?
这是我的页面代码:
MODI.Document md = new MODI.Document();
md.Create("c:\\temp\\mpk.tiff");
md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);
MODI.Image image = (MODI.Image)md.Images[0];
FileStream createFile = new FileStream("c:\\temp\\mpk.txt", FileMode.CreateNew);
StreamWriter writeFile = new StreamWriter(createFile);
writeFile.Write(image.Layout.Text);
writeFile.Close();
md.Close();
我可以以某种方式指定图像的区域吗?
任何帮助将不胜感激!
I need to OCR a specific region of a scanned document and I am using MODI (Microsoft's Document Imaging COM object).
My code currently OCR's the entire page (quite accurately!), but I would like to target a specific region of the page where the text is always static (order number). How can I do this?
Here is my code for the page:
MODI.Document md = new MODI.Document();
md.Create("c:\\temp\\mpk.tiff");
md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);
MODI.Image image = (MODI.Image)md.Images[0];
FileStream createFile = new FileStream("c:\\temp\\mpk.txt", FileMode.CreateNew);
StreamWriter writeFile = new StreamWriter(createFile);
writeFile.Write(image.Layout.Text);
writeFile.Close();
md.Close();
Can I somehow specify the region of the image?
Any help would be greatly appreciated!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
无法裁剪我使用 MODI 对象模型看到的图像。另一种方法是为其提供仅包含您要转换的订单号的图像。您可以使用 System.Drawing 命名空间中的类从原始文件中创建它。请查看此 MSDN 页面以获取示例代码。
There's no way to crop the image that I see with the MODI object model. The alternative is to provide it with an image that contains just the order number you want to convert. You can use the classes in the System.Drawing namespace to create it from the original. Check this MSDN page for sample code.