Python Selenium 访问 HTML 源
如何使用 Python 中的 Selenium 模块获取变量中的 HTML 源?
我想做这样的事情:
from selenium import webdriver
browser = webdriver.Firefox()
browser.get("http://example.com")
if "whatever" in html_source:
# Do something
else:
# Do something else
我该怎么做?我不知道如何访问 HTML 源。
How can I get the HTML source in a variable using the Selenium module with Python?
I wanted to do something like this:
from selenium import webdriver
browser = webdriver.Firefox()
browser.get("http://example.com")
if "whatever" in html_source:
# Do something
else:
# Do something else
How can I do this? I don't know how to access the HTML source.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(9)
您需要访问
page_source
属性:You need to access the
page_source
property:现在您可以应用 BeautifulSoup 函数来提取数据...
Now you can apply BeautifulSoup function to extract data...
driver.page_source将帮助您获取页面源代码。您可以检查文本是否存在于页面源中。
如果要将页面源存储在变量中,请在 driver.get 之后添加以下行:
并将 if 条件更改为:
driver.page_source will help you get the page source code. You can check if the text is present in the page source or not.
If you want to store the page source in a variable, add below line after driver.get:
and change the if condition to:
通过 Selenium2Library,您可以使用
get_source()
With Selenium2Library you can use
get_source()
通过使用页面源代码,您将获得完整的 HTML 代码。
因此,首先决定您需要在其中检索数据或单击元素的代码块或标签。
您可以通过名称、XPath、id、链接和 CSS 路径查找元素。
By using the page source you will get the whole HTML code.
So first decide the block of code or tag in which you require to retrieve the data or to click the element..
You can find the elements by name, XPath, id, link and CSS path.
要回答有关获取用于 urllib 的 URL 的问题,只需执行以下 JavaScript 代码:
To answer your question about getting the URL to use for urllib, just execute this JavaScript code:
您可以简单地使用
WebDriver
对象,并通过其@property
字段page_source
访问页面源代码...尝试以下代码片段: -)
You can simply use the
WebDriver
object, and access to the page source code via its@property
fieldpage_source
...Try this code snippet :-)
完整代码:
Complete code:
我建议使用 urllib 获取源代码,如果您打算解析,使用类似 Beautiful Soup 的内容。
I'd recommend getting the source with urllib and, if you're going to parse, use something like Beautiful Soup.