如何使用Shadow-root网站中的产品元素加速？

发布于 2025-01-31 03:23:35 字数 1254 浏览 4 评论 0原文

我是Python的新手，我正在尝试学习。我目前正在一个具有阴影根部的网站上进行网络刮擦项目，但是我在访问Shadow-root下的元素方面遇到了困难。我真的很感谢您的帮助和一些建议。该程序为“ untitled0.py”。另外，我试图仅使用Selenium Webdriver，而作为最后一个度假胜地的Shadowpy。无论我做什么，product_name_tos返回一个空列表。

import pandas as pd
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
service = Service(executable_path=ChromeDriverManager().install())
driver_TOS = webdriver.Chrome(service=service)
driver_TOS.get("https://www.bedbathandbeyond.com/store/category/college/decor/10625?icid=hp_homepage_4acrs_slot2_bath")
prod_names_TOS = []
prod_prices_TOS = []
time.sleep(5)
shadow_host_TOS = driver_TOS.find_element("id", "wmHostPrimary")
shadow_root = driver_TOS.execute_script('return arguments[0].shadowRoot', shadow_host_TOS)
#shadow_root_TOS = shadow_host_TOS.shadowRoot
products_TOS = shadow_root.find_elements("css selector", ".prodCardWrap")
for product_TOS in products_TOS:
    product_container_TOS = product_TOS.find_element("class name", "prodCardR")
    product_name_TOS = product_container_TOS.find_element("class name", "prodTitle").get_element("innerText")
    prod_names_TOS.append(product_name_TOS)
print(prod_names_TOS)

原文

I am new to python and I am trying to learn. I am currently doing a web scraping project on a website that has a shadow-root, but I have trouble accessing the elements under the shadow-root. I would really appreciate a bit of help and some advice. The program is 'untitled0.py'. Also, I am trying to only use selenium webdriver, and as a last resort shadowpy. Whatever I did, product_name_TOS returned an empty list.

import pandas as pd
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
service = Service(executable_path=ChromeDriverManager().install())
driver_TOS = webdriver.Chrome(service=service)
driver_TOS.get("https://www.bedbathandbeyond.com/store/category/college/decor/10625?icid=hp_homepage_4acrs_slot2_bath")
prod_names_TOS = []
prod_prices_TOS = []
time.sleep(5)
shadow_host_TOS = driver_TOS.find_element("id", "wmHostPrimary")
shadow_root = driver_TOS.execute_script('return arguments[0].shadowRoot', shadow_host_TOS)
#shadow_root_TOS = shadow_host_TOS.shadowRoot
products_TOS = shadow_root.find_elements("css selector", ".prodCardWrap")
for product_TOS in products_TOS:
    product_container_TOS = product_TOS.find_element("class name", "prodCardR")
    product_name_TOS = product_container_TOS.find_element("class name", "prodTitle").get_element("innerText")
    prod_names_TOS.append(product_name_TOS)
print(prod_names_TOS)

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

半﹌身腐败 2025-02-07 03:23:35

几乎所有内容都是正确的，该方法中只有一个小错误

product_name_TOS = product_container_TOS.find_element("class name", "prodTitle").get_element("innerText")

是.get_element，而是.get_attribute。请注意，在这种情况下，您也可以使用.text

Almost everything is correct, there is just a small error in

product_name_TOS = product_container_TOS.find_element("class name", "prodTitle").get_element("innerText")

The method is not .get_element but .get_attribute. Notice that in this case you can also use .text

回复收藏 0 原文

~没有更多了~

关于作者

罗罗贝儿

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

如何使用Shadow-root网站中的产品元素加速？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

达拉崩吧

PANGOO

kkgtx

WordPress小学生

酷炫老祖宗

硪扪都還晓

友情链接

如何使用Shadow-root网站中的产品元素加速？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

达拉崩吧

PANGOO

kkgtx

WordPress小学生

酷炫老祖宗

硪扪都還晓

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。