素材牛VIP会员
用python爬取猫眼票房的数据,为什么会是这样的乱码呢
 飞***e  分类:Python  人气:1180  回帖:2  发布于6年前 收藏

http://piaofang.maoyan.com/?d... 这是要爬的网站,我要取得今天票房大盘数据,我用下面的代码爬去

import requests

from bs4 import BeautifulSoup
res = requests.get("http://piaofang.maoyan.com/?date=2016-09-07")
res.encoding = "utf-8"
soup = BeautifulSoup(res.text,"lxml")
print(soup)

输出的是[<span id="ticket_count"><i class="cs gsBlur">.万</i></span>]这样的,关键数据怎么是乱码呢

求哪位好人帮忙看下原因,谢谢

 标签:python

讨论这个帖子(2)垃圾回帖将一律封号处理……

Lv4 码徒
cx***de 页面重构设计 6年前#1

因为网站用了自定义字体来替代数字。。自己把这些字符做个对应表转换吧

Lv3 码奴
赵***6 Linux系统工程师 6年前#2

楼上说的还真没想到,我还以为是js做了加密呢,还有另外一种方法可以获取数据

这是个ajax请求,通过控制台可以分析的,请求参数中的uid请看页面中,相信题主能找到的,类似的可以得到昨天、明天的数据,等等

 文明上网,理性发言!   😉 阿里云幸运券,戳我领取