beautifulsoup

beautifulsoup

文章 107 浏览 127

刮擦时,我得到了一些垃圾价值

大家好,请使用BS4检查以下代码以刮擦网页。 import requests from bs4 import BeautifulSoup import pandas as pd url = 'https://www.nfl.com/stand…

亢潮 2025-02-10 20:49:31 2 0

如何在不使用其数据框架索引的情况下用熊猫刮擦特定的表?

我目前正在尝试使用大熊猫刮擦HTML表,并尝试使用美丽的小组,但正在遇到问题。 这是url: https://ciffc.net/en/en/en/ciffc/ext/成员/sitrep/ 由于…

猥︴琐丶欲为 2025-02-10 20:08:17 6 0

Beautifulsoup在尝试访问IMG链接时返回空列表

我尝试使用代码来查找链接。我已经缩小了HTML以找到相关图像并将其全部重新进行。但是,它正在返回一个空列表。 我似乎不明白问题实际上在哪里。 impo…

一萌ing 2025-02-10 19:31:26 1 0

使用pandas read_html在网页上刮擦多个表,然后将它们转换为dataframe& CSV

我正在尝试从BLS网站提取多个桌子,并打入各种障碍。我可以提取桌子,我查看了其他帖子 - (如何使用Python Pandas的read_html?读取具有多个tbodies…

海未深 2025-02-10 17:52:54 1 0

Web刮擦和使用Python下载Excel文件

我一直在尝试为其Excel文件刮擦网站。我打算为其中包含来自数据档案部分的大部分数据做一次。我可以通过URLIB请求一次下载单个文件,并在几个不同的文…

攒一口袋星星 2025-02-10 16:40:14 3 0

如何获得包裹在表中的标签值?

Designation : PARTNER Category : SPORTS GEARS Address : A-148, WARD NO.4, PAINTER STREETSIALKOT-CANTT. Phone : 4603886, soup = bs(page.cont…

心是晴朗的。 2025-02-10 16:14:37 4 0

如何刮擦嵌套的Div类

嗨,我有一个本地HTML文件,其中包含聊天中的消息: 01:01 XYZ In reply to this message Eat some chocolate 现在我想创建一个DF,显示每条消息的某…

何其悲哀 2025-02-10 13:43:46 2 0

如何从刮擦页面中删除字符串的大部分?

我做了一个网络刮板,以获取Wikipedia页面的信息文本。我得到了想要的文字,但我想切断底部文字的很大一部分。我已经尝试了其他一些解决方案,但是有…

冷︶言冷语的世界 2025-02-10 12:48:04 1 0

使用Beautifutsoup从Python中的标签中解析一个特定单词

我使用Beautifutsoup来解析XML文件,以便通过标签名称进行解析 但是,我可以在标签内搜索另一个词吗? Data = soup.find_all('Data') for Data in Dat…

抽个烟儿 2025-02-10 11:49:57 3 0

我如何单击第一个Div类“链接”;如果他们都有相同的Div类名称?

我正在尝试单击每个产品瓷砖的链接 https://wwww.hugoboss .com/uk/men-clothing/,使用硒。 WebCode: 我当前的代码: import numpy as np import p…

挽清梦 2025-02-10 10:26:05 3 0

如何使用Python在Wikipedia页面上获取页面创建日期?

我有一个问题,如何在表中获取特定文本。在此示例中,Wikipedia页面上的页面创建日期。例如,在此链接 中= info 我正在使用BeautifulSoup,但是我仍然…

甜扑 2025-02-10 07:53:15 6 0

刮擦动态加载的网站,而无需更改地址Python/Selenium

如何从A&LT刮擦清单; ul>标签如果在原始网站上单击后仅在DIV中加载列表? 我尝试使用硒来自动点击自动化,但是由于它不会更改网站的HTTPS地址,…

沉鱼一梦 2025-02-10 07:13:06 3 0

为什么在BS4中找到了BS4的发现,与Dict合作谁有双重侵犯论点?

在此处输入图像描述 学习BS4和Findall()没有使用DICE,并且使用两个Atribute标签。错误在哪里?因为它仅返回“绿色”标签,而没有“红色”。 from u…

你的他你的她 2025-02-10 06:01:39 1 0

为什么此文本属性破坏了我的美丽套件?

我是新手的美丽小组,所以我在此网站上练习我的网络刮擦,文本属性不断破坏.find()函数。这是代码: from bs4 import BeautifulSoup import request…

巾帼英雄 2025-02-10 04:50:56 3 0

如何在美丽的小组中保留订单?

我正在使用美丽的肥皂来提取网页中的可见文本,因此我尝试实现以下解决方案: def filter_visible_texts(element): if element.parent.name in ['styl…

蓝眸 2025-02-10 00:58:14 2 0
更多

推荐作者

櫻之舞

文章 0 评论 0

弥枳

文章 0 评论 0

m2429

文章 0 评论 0

野却迷人

文章 0 评论 0

我怀念的。

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文