素材牛VIP会员
python cookie 抓取不全问题。
 风***在  分类:Python  人气:939  回帖:1  发布于6年前 收藏
cookie = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie)) 

urllib2.install_opener(opener)

opener.addheaders.append(('Referer', 'http://cn.dongguantoday.com/special/dgoec7/playerc.asp?id=4520'))
opener.addheaders.append(('Accept-Language', 'zh-CN'))
opener.addheaders.append(('Host', 'vote.sun0769.com'))
opener.addheaders.append(('User-Agent', 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.0'))
opener.addheaders.append(('Connection', 'Keep-Alive'))

postdata = urllib.urlencode({
    'itemID':'4483',
    'resultpage':'http://cn.dongguantoday.com/special/dgoec7/playerc.asp?id=4520',
    'sessionId':'signp1502',
    'metaid':'1502',
    'SurveyCode':'696287',   
})

req1 = urllib2.Request(
    url = 'http://vote.sun0769.com/signup/actiondgoec7.asp?itemid=4520',
    data = postdata
)

result1 = opener.open(req1)

这是主要代码

用这种方式登录网站,发现无论我怎么登录,都会显示下图,然后通过打印cookie和浏览器抓到的包做对比,发现缺少一个cookies,叫A吧;然后会多了一个cookies,叫B吧;

我用浏览器手动删除A发现只要是缺少A,就会被服务器拒绝访问,也会显示下图:


浏览器的cookies:


我脚本获得的cookies:

所以现在我想请教,有什么方法可以抓到那个cookies?我试过将cookies保存在一个文件内,将A直接复制下来,再通过读取文件来访问网站,发现还是不行,那我应该下一步往哪个方向走,去获得正确的cookies,或者说,不会让服务器端拒绝我的访问呢

讨论这个帖子(1)垃圾回帖将一律封号处理……

Lv6 码匠
雪***儿 职业无 6年前#1
 文明上网,理性发言!   😉 阿里云幸运券,戳我领取