如何从屏幕上获取文本

发布于 2024-07-13 09:15:29 字数 412 浏览 8 评论 0原文

有一些 Win OS API 调用，可以让人们从屏幕上获取文本，

而不是通过获取快照然后对其进行 OCR 操作，而是通过 API

获取用户指向的鼠标下方的文本并点击。

这就是 Babylon (http://www.babylon.com) 和一键解答 (< a href="http://www.answers.com/main/download_answers_win.jsp" rel="nofollow noreferrer">http://www.answers.com/main/download_answers_win.jsp）以及许多其他工作。

有人可以指出我获得此功能的正确方向吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

情绪操控生活 2024-07-20 09:15:29

没有直接的方法来获取文本。应用程序可以以无数种不同的方式呈现文本（Windows API 就是其中之一），并且在呈现之后 - 它只是一堆像素。

不过，您可以尝试的一种方法是找到鼠标正下方的窗口并尝试从中获取文本。这在大多数标准 Windows 控件（标签、文本框等）上可以正常工作，但在 Internet 浏览器上不起作用。

我认为您能做的最好的事情就是让您的应用程序以上述方式支持尽可能多的不同（通用）控件。

回复收藏 0 原文

居里长安 2024-07-20 09:15:29

您可以使用 GetWindowText API 获取每个窗口的文本。可以使用 GetCursorPos API 找到鼠标位置。

在 Delphi 中你可以使用这个函数（感谢下面的 Peter）

Function ChildWindowUnderCursor: HWND;
Var
  hw, lasthw: HWND;
  pt, clientpt: TPoint;
Begin
  Result := 0;
  GetCursorPos( pt );
  // find top-level window under cursor
  hw := WindowFromPoint( pt );
  If hw = 0 Then Exit;

  // look for child windows in the window recursively
  // until we find no new windows
  Repeat
    lasthw := hw;
    clientpt := Pt;
    Windows.ScreenToClient( lasthw, clientpt );
    // Use ChildwindowfromPoint if app needs to run on NT 3.51!
    hw := ChildwindowFromPointEx( lasthw, clientpt, CWP_SKIPINVISIBLE );
  Until hw = lasthw;
  Result := hw;
End;

问候，
利文

You can get the text of every window with the GetWindowText API. The mouse position can be found with the GetCursorPos API.

In Delphi you could use this function (kudos to Peter Below)

Function ChildWindowUnderCursor: HWND;
Var
  hw, lasthw: HWND;
  pt, clientpt: TPoint;
Begin
  Result := 0;
  GetCursorPos( pt );
  // find top-level window under cursor
  hw := WindowFromPoint( pt );
  If hw = 0 Then Exit;

  // look for child windows in the window recursively
  // until we find no new windows
  Repeat
    lasthw := hw;
    clientpt := Pt;
    Windows.ScreenToClient( lasthw, clientpt );
    // Use ChildwindowfromPoint if app needs to run on NT 3.51!
    hw := ChildwindowFromPointEx( lasthw, clientpt, CWP_SKIPINVISIBLE );
  Until hw = lasthw;
  Result := hw;
End;

Regards,
Lieven

回复收藏 0 原文

眼波传意 2024-07-20 09:15:29

Windows 具有用于无障碍工具（例如盲人屏幕阅读器）的 API。（较新的版本也用于其他目的，例如 UI 自动化和测试。）它适用于许多应用程序，甚至大多数不使用标准 Windows 控件即可呈现自己内容的浏览器。它不适用于所有应用程序，但在大多数情况下可用于计算鼠标下的文本。

当前的 API 称为 Windows自动化API。描述一般如何执行此操作超出了 Stack Overflow 答案的范围，因此我只是提供了文档的链接。

首次发布此问题时广泛使用的旧 API 称为 Microsoft Active Accessibility API。与现代 API 一样，这里的范围太宽泛，无法在此详细说明。

请注意，这两个 API 的文档既是为构建辅助工具（如屏幕阅读器）的开发人员编写的，也是为编写希望与这些辅助工具兼容的应用程序的开发人员编写的。

基本思想是辅助工具获取目标应用程序窗口提供的 COM 接口，并且它可以使用这些接口来确定控件及其文本以及它们在逻辑上和空间上的关联方式。由标准 Windows 控件组成的应用程序大多会自动受到支持。具有自定义 UI 实现的应用程序必须提供这些接口。幸运的是，重要的浏览器，例如主流浏览器，已经完成了支持这些接口的工作。

回复收藏 0 原文