用于网站解析的高级 Excel/Visual Basics

发布于 2024-12-20 02:45:41 字数 303 浏览 7 评论 0原文

我在一个 Excel 文档中拥有指向 500 个维基百科/维基媒体维基、讨论页面和历史页面的链接，我想对其进行解析以确定诸如有多少 Wiki 在讨论页面中提到“广告”或“促销”、持续多长时间等内容我已经弄清楚如何编写一个 Visual Basics

用户定义函数来获取完整的 HTML。是否有插件或其他方式来获取两个标签或标识符之间的文本（如屏幕上显示的那样），以便我可以提取所需的信息？

与专业开发人员相比，我是一名商业专业人士，编码经验非常有限。但如果你能给我指出正确的方向和一些好的教程，我就可以学习。如果有人可以提供帮助，我也有兴趣支付一些额外的钱。

需要登录才能够评论，你可以免费注册一个本站的账号。

慈悲佛祖 2024-12-27 02:45:41

您可以使用 XML 解析器和正则表达式来搜索 HTML 文档中的文本。

要获取浏览器中显示的文本，请编写一个函数来删除所有标签。尽管如此，它可能并不总是准确的，因为 CSS 和 Javascript 可以改变屏幕上可见的内容。

~没有更多了~

暂无简介

文章

29 人气

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0