node怎么通过cheerio去分析网页?

发布于 2022-09-11 20:12:10 字数 1387 浏览 18 评论 0

var request = require('request');
var cheerio = require('cheerio');


request('https://music.163.com/#/song?id=760058',function(err,result){
    if(err){
        console.log(err);
    }
    var $ = cheerio.load(result.body);
    console.log($)
})

为啥结果是这样的

{ [Function: initialize]
  fn:
   initialize {
     constructor: [Circular],
     _originalRoot:
      { type: 'root',
        name: 'root',
        namespace: 'http://www.w3.org/1999/xhtml',
        attribs: [Object: null prototype] {},
        'x-attribsNamespace': [Object: null prototype] {},
        'x-attribsPrefix': [Object: null prototype] {},
        children: [Array],
        parent: null,
        prev: null,
        next: null } },
  load: [Function],
  html: [Function],
  xml: [Function],
  text: [Function],
  parseHTML: [Function],
  root: [Function],
  contains: [Function],
  merge: [Function],
  _root:
   { type: 'root',
     name: 'root',
     namespace: 'http://www.w3.org/1999/xhtml',
     attribs: [Object: null prototype] {},
     'x-attribsNamespace': [Object: null prototype] {},
     'x-attribsPrefix': [Object: null prototype] {},
     children: [ [Object], [Object] ],
     parent: null,
     prev: null,
     next: null },
  _options:
   { withDomLvl1: true,
     normalizeWhitespace: false,
     xml: false,
     decodeEntities: true } }

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

缱倦旧时光 2022-09-18 20:12:10

获取到 $ 后直接和 jquery 一样,用选择器去获取dom元素就可以了。

var request = require('request');
var cheerio = require('cheerio');
request('https://music.163.com/#/song?id=760058',function(err,result){
    if(err){
        console.log(err);
    }
    var $ = cheerio.load(result.body);
    console.log($('title').text()); // 打印网易云音乐
})

具体的爬虫实战,可以参考我的爬虫项目,https://github.com/yhlben/cdfang-spider/

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文