request库,url有中文时报错The header content contains invalid characters

发布于 2022-09-06 03:47:07 字数 1052 浏览 15 评论 0

代码

let request = require('request');
let url = "https://www.baidu.com/s?wd=我是个大天赐,啦啦啦啦啦啦";

request(url, function (error, response, body) {
    if (!error && response.statusCode == 200) {
        console.log(body);
    } else {
        console.log(error);
    }
});

node version v8.9.0

报错

TypeError: The header content contains invalid characters
    at validateHeader (_http_outgoing.js:497:11)
    at ClientRequest.setHeader (_http_outgoing.js:501:3)
    at new ClientRequest (_http_client.js:173:14)
    at Object.request (https.js:240:10)
    at Request.start (D:\node_root\socket\node_modules\request\request.js:740:32)
    at Request.end (D:\node_root\socket\node_modules\request\request.js:1398:10)
    at end (D:\node_root\socket\node_modules\request\request.js:567:14)
    at Immediate.<anonymous> (D:\node_root\socket\node_modules\request\request.js:581:7)
    at runCallback (timers.js:789:20)
    at tryOnImmediate (timers.js:751:5)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

金兰素衣 2022-09-13 03:47:07

最终的结果呢是把中文encodeURI+设置一下UA就好了

let request = require('request');
let url = "https://www.baidu.com/s?wd=%E6%95%B4%E5%A4%A9%E5%B0%B1%E6%98%AF%E8%83%8C%E8%83%8C%E8%83%8C%E8%AE%B0%E8%AE%B0%E8%AE%B0%EF%BC%8C%E6%88%96%E8%80%85%E6%9C%89%E4%BA%9B%E6%AD%A3%EF%BC%8C%E6%97%B6%E9%97%B4%E5%B0%B1%E8%BF%99%E4%B9%88%E6%B5%AA%E8%B4%B9%E4%BA%86";

let options = {
    url: url,
    method: 'GET',
    headers: {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36',
    }
}

request(options, function (error, response, body) {
    if (!error && response.statusCode == 200) {
        console.log(body);
    } else {
        console.log(error);
    }
});
感情旳空白 2022-09-13 03:47:07

URL有中文,可以换个写法:

let request = require('request');
// let url = "https://www.baidu.com/s?wd=我是个大天赐好建华大街的,啦啦啦啦啦啦";
var options = { 
  method: 'GET',
  url: 'https://www.baidu.com/s',
  qs: { wd: '我是个大天赐好建华大街的,啦啦啦啦啦啦' },
  headers: { 
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.89 Safari/537.36' 
  }
};
request(options, function (error, response, body) {
    if (!error && response.statusCode == 200) {
        console.log(body);
    } else {
        console.log(error);
    }
});
梦冥 2022-09-13 03:47:07

不用 Request 库的代码如下,可能对你有帮助:

var http = require('https');
const { URL } = require('url');

var addr = new URL('https://www.baidu.com/s?wd=我是个大天赐好建华大街的,啦啦啦啦啦啦');

http.get(addr, function(res) {
  var result = '';

  res.on('data', function(data) {   result += data.toString('utf8');  });
  res.on('end', function() {    console.log(result);  });
});

请求不到数据的原因,分析如下:

  1. 把地址直接贴到 chrome 浏览器的地址栏,在开发者工具观察 HTTP 请求;
  2. 发现有文档的请求,有图片的请求,还有脚本的请求;
  3. 怀疑搜索是通过一个 all_async_search.js 脚本发起的,请见下面的截图;

用 node.js 程序,只请求了一部分数据,请求来页面,没有获得页面上外链的 js 脚本。即使请求得到脚本,也没有能力执行 js 脚本程序,所以没有最终请求到搜索结果。如果想请求到搜索结果,需要对方提供 HTTP API 接口(现在比较常用的是 RESTful API)。换句话说,这个页面或者 URL 地址是给浏览器访问的,不是用来给程序访问的。

王顶,node.js, 408542507@qq.com

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文