用selenium模拟登陆裁判文书网，系统报错找不到元素。

发布于 2022-09-05 04:41:49 字数 1213 浏览 9 评论 0

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
dcap = dict(DesiredCapabilities.PHANTOMJS)
dcap["phantomjs.page.settings.userAgent"]=("Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36")
url ="http://wenshu.court.gov.cn/User/RegisterAndLogin?Operate=1"

driver = webdriver.PhantomJS(executable_path='C:\\Users\\wang\\Downloads\\phantomjs-2.1.1-windows\\phantomjs-2.1.1-windows\\bin\\phantomjs.exe')

driver.get(url)
import time
time.sleep(30)
driver.find_element_by_xpath('//*[@id="login_Name"]').send_keys("398915607@qq.com")
driver.find_element_by_xpath('//*[@id="login_Pwd_Temp"]').send_keys("wstktb")
driver.find_element_by_xpath('//*[@id="btnLogin"]').click()
driver.quit()

chrome上观察源码明明都有的，这个网站看来看去也没有frame的标签，打印page_source也只有几行js代码。，小弟最近刚开始学习爬虫，实在是十分困惑啊，恳请各位求教。

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

鲜肉鲜肉永远不皱 2022-09-12 04:41:51

这网站也太鸡吧卡了

from selenium import webdriver

driver = webdriver.Chrome()
driver.get("http://wenshu.court.gov.cn/User/RegisterAndLogin?Operate=1")

driver.find_element_by_id('login_Name').send_keys("398915607@qq.com")
driver.execute_script('$("#login_Pwd").removeClass("display_none")')
driver.find_element_by_id('login_Pwd').send_keys("wstktb")
driver.find_element_by_id('btnLogin').click()

回复收藏 0

傲鸠 2022-09-12 04:41:50

我测试了一下，第一次打开这个页面的时候，如果你没有他需要的cookie，那么你进入的就是那个全是js的页面，HTTP状态码202，此时该域名下会生成一个cookie（我不确定怎么来的）。
然后浏览器会自动刷新，js会在请求中加入一段cookie（该cookie不保存在浏览器，且每次都不一样），服务端返回正常的页面，HTTP状态码200。
题主可以用chrome的view-source来测试。
所以你说的source只有几行代码那就是第一次打开的情况，我对selenium不是很了解，不过应该是因为没有自动跳转的问题，具体原因可能是你的配置、js中有判断。

回复收藏 0

~没有更多了~