素材牛VIP会员
该选择哪个语言开发爬虫?
 十***刻  分类:PHP代码  人气:2220  回帖:23  发布于6年前 收藏

需要开发个采集腾讯、新浪微博的评论数据。
如果直接使用官方提供的API,会有很多数据获取不到。所以可能得自己写了。
我主要是想使用C++来开发的,其次才是PHP。在没办法的情况下,才会考虑使用python进行开发!
网上大概了解了下,很多采集程序都是使用python来开发的。因为python的网络库很多,很丰富,开发起来方便快捷。
PHP的也有个snoopy类库,C++的就不清楚了。
不知道,C++中有没有这方面的爬虫类库推荐呢?

讨论这个帖子(23)垃圾回帖将一律封号处理……

Lv6 码匠
Ga***er 软件测试工程师 6年前#1

如果是我的话,我会用 Node.js

Node.js 有一个 Cheerio 库,用来解析 HTML 效率十分不错。它的 API 风格是类似 jQuery 的。

Lv5 码农
38***38 职业无 6年前#2

爬虫基本上就是网页抓去+内容分析了吧。

我也建议选择类库简单丰富的语言,比如Python和Ruby应该都不错。

Ruby可以选择的有Crul,mechanize,nokogiri,hpricot等。

Lv6 码匠
生***炸 UI设计师 6年前#3

php里有phpQuery,语法和jquery差不多,非常的好用!

上一页123下一页
 文明上网,理性发言!   😉 阿里云幸运券,戳我领取