nodejs 中http模块的async 用法
写了一个简单的基于chreeio的数据爬取代码,node http的模块获取html 然后用chreeio爬取。
想使用最新的async await 来异步操作.代码如下:
let request = require('request');
let cheerio = require('cheerio');
let fs = require('fs');
let http = require('http');
let https = require('https');
let newCollection = [];
let newCollection_item = {
title: '',
href: ''
};
const hrefPrefix = 'xxxxxxxxx'
class Crawler {
static test() {
// await getList();
//想在这里直接获取newCollection
console.log(this.getList());
}
//这里是一个异步获取list
static async getList() {
return new Promise((resolve, reject) => {
http.get("http://xxxx/xxxxxx.com", (res) => {
res.setEncoding('utf-8');
let html = "";
res.on('data', (chunk) => {
html += chunk;
});
res.on('end', () => {
let $ = cheerio.load(html);
//爬取数据
$('#ajaxtable tbody tr').each(function(index, item) {
if (index > 4) {
let title = $(this).children().eq(1).find('h3').find('a').text();
let href = `${hrefPrefix}` + $(this).children().eq(1).find('h3').find('a').attr('href');
newCollection_item = { title, href };
newCollection.push(newCollection_item);
}
}, this);
resolve(res);
// console.log("=============================================list=================================\n", newCollection)
})
})
})
return newCollection;
}
}
Crawler.test();
不知道哪里写错了,目的就是想在test()里面能直接拿到getList返回的newCollection;
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
来,我来回答你这问题
首先我觉得,在非必须情况下,没必要费用es6的class,有的时候模块直接导出一个对象提好的。如果是一个class,实例方法你还要new一个对象才能调用,如若不然,还的申明为类(静态)方法。反而不如js的{xx:xxx}来的方便。
再说你的问题,主要是:如果你调用的一个方法返回值是一个promise。那么你有两种办法可获得。拿你的代码做示例
下边贴上我的爬虫
效果图
static async test()
async
函数里才能用await
。