如何使用现有的 Windows 功能从 UI 中提取文本
我环顾四周,发现了与此相关的各种零碎信息,但没有什么具体的。
我需要找到一种除 Spy++ 工具之外的提取 UI 元素的方法。我能够根据 HWND 定位屏幕项目及其底层文本标题,但是 Firefox 等第 3 方应用程序会带来更多问题,因为它们只有一个大窗口用于显示。如果有人对如何本地获取屏幕坐标以进行 OCR 或控制 UI 元素的识别(例如网页)有任何想法,我很乐意听取您的意见。
I've done a bit of looking around and found various bits and pieces relating to this, but nothing concrete.
I need to find a method of extracting UI elements other than that of the Spy++ tool. I'm able to locate screen items and their underlying text captions based on HWND, however 3rd party apps such as Firefox offer further problems as they only have one large window for the display. If anyone has any ideas on how to natively get screen coordinates to do an OCR or control recognition of UI elements within, say, a web page I'd love to hear from you.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
如果您希望以编程方式访问 Firefox 所看到的网页,还有更好的方法。
尝试 Watir 或 selenium。这些用于测试 Web 应用程序,它们允许您有问题地控制 Web 浏览器。
If what you want programmatic access a web page as Firefox sees it, there are much better ways.
Try Watir or selenium. These are for testing web applications, and they allow you to problematically control the web browser.