requests爬虫结果不显示中文。

发布于 2022-09-06 00:54:00 字数 331 浏览 17 评论 0

lz小白,刚开始接触爬虫,代码如下
图片描述

但是教程里r.text的结果是:

图片描述

求教,是哪里出问题了导致我的结果无法显示中文?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

站稳脚跟 2022-09-13 00:54:00

情景1:

print(rep.text[:1000])  #显示中文

情景2:unicode转str

print(rep.text.encode('utf-8','ignore')[:1000])

假装不在乎 2022-09-13 00:54:00
r.text[:1000].encode("utf-8")
r.text[:1000].encode("GB2312")
r.text[:1000].decode("utf-8")
r.text[:1000].decode("gb2312")

四种方法,一个一个试试,看看那个可以了就确定用那个。

江湖彼岸 2022-09-13 00:54:00

python2.x中, 字符串分为两种,有u前缀和没有u前缀, 直接用print 打印,可以显示

>>> hi = '你好'
>>> 
>>> hi
'\xe4\xbd\xa0\xe5\xa5\xbd'
>>> type(hi)
<type 'str'>
>>> print hi
你好
>>> hi = u'你好'
>>> hi
u'\u4f60\u597d'
>>> type(hi)
<type 'unicode'>
>>> print hi
你好
昔梦 2022-09-13 00:54:00
r.encoding = "utf-8"
r.text[:1000]

编码改成"utf-8"乱码

print(r.text[:1000])

结果:

gbk
GB2312
<!-- shouji -->
<!DOCTYPE HTML>
<html lang="zh-CN">
<head>
    <meta http-equiv="Content-Type" content="text/html; charset=gbk" />
    <title>【华为麦芒6】华为 HUAWEI 麦芒 6 全网通 4GB+64GB版 流光金 移动联通电信4G手机 双卡双待【行情 报价 价格 评测】-京东</title>
    <meta name="keywords" content="HUAWEI麦芒6,华为麦芒6,华为麦芒6报价,HUAWEI麦芒6报价"/>
    <meta name="description" content="【华为麦芒6】京东JD.COM提供华为麦芒6正品行货,并包括HUAWEI麦芒6网购指南,以及华为麦芒6图片、麦芒6参数、麦芒6评论、麦芒6心得、麦芒6技巧等信息,网购华为麦芒6上京东,放心又轻松" />
    <meta name="format-detection" content="telephone=no">
    <meta http-equiv="mobile-agent" content="format=xhtml; url=//item.m.jd.com/product/4971133.html">
    <meta http-equiv="mobile-agent" content="format=html5; url=//item.m.jd.com/product/4971133.html">
    <meta http-equiv="X-UA-Compatible" content="IE=Edge">
    <link rel="canonical" href="//item.jd.com/4971133.html"/>
        <link rel="dns-prefetch" href="//misc.360buyimg.com"/>
    <link rel="dns-prefetch" href="//static.360buyimg.com"/>
    <link rel="dns-prefetch" href="//img10.360buyimg.com"/
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文