从网站提取元数据

发布于 2024-11-16 01:59:14 字数 91 浏览 3 评论 0原文

我想知道javascript中是否有一种方法可以让我处理html源代码,让我可以取出我想要的特定标签?

抱歉,如果这听起来很简单或太简单。我是编程新手。

I was wondering if there's a way in javascript that allows me to process the html source code that allows me to take out specific tags that I want?

Sorry if it sounds easy or too simple. i am new to programming.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

叹倦 2024-11-23 01:59:14

如果字符串中有 HTML,那么您可以使用:

var str = '<html></html>'; // your html text goes here
var div = document.createElement('div');
div.innerHTML = str;
var dom = div.firstChild; // dom is the object you want,
                          // you can manipulate it using standard dom methods

或者,使用 jQuery。 jQuery 是一个帮助您更轻松地操作和访问 HTML 元素的库。首先,将其添加到文档的头部:

<script type="text/javascript" src="https://ajax.googleapis.com/ajax/libs/jquery/1.6.1/jquery.min.js"></script>

这是对 jQuery 库的引用。然后,执行:

var foo = $("<html>Your html here</html>");

或者,如果您的 html 位于变量中(例如 str),您可以执行以下操作:

var foo = $(str);

然后,您可以通过多种方式操作和解析 foo。例如,要删除所有段落元素,您可以使用

foo.remove('p');

或者,要删除 id="bar" 的段落元素,请使用:

foo.remove('p.bar');

完成修改后,您可以使用以下方法获取新的 html 文本:

foo.html();

Why is your html in a细绳?不是当前页面的html吗?

If you have the HTML in a string, then you can use:

var str = '<html></html>'; // your html text goes here
var div = document.createElement('div');
div.innerHTML = str;
var dom = div.firstChild; // dom is the object you want,
                          // you can manipulate it using standard dom methods

Alternately, use jQuery. jQuery is a library to help you manipulate and access HTML elements more easily. First, add this to the head of your document:

<script type="text/javascript" src="https://ajax.googleapis.com/ajax/libs/jquery/1.6.1/jquery.min.js"></script>

This is a reference to the jQuery library. Then, do:

var foo = $("<html>Your html here</html>");

Or, if your html is in a variable (e.g. str), you can do:

var foo = $(str);

Then, you can manipulate and parse foo in a number of ways. For example, to remove all paragraph elements, you would use

foo.remove('p');

Or, to remove the paragraph element with id="bar", use:

foo.remove('p.bar');

Once you are done your modifications, you can get the new html text using:

foo.html();

Why is your html in a string? Is it not the html of the current page?

我不咬妳我踢妳 2024-11-23 01:59:14

使用 DOM,如果您了解结构,它可以从网页中提取数据。

Use DOM it can pull data from webpages if you know the structure.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文