ADSL拨号VPS包含了中国大陆（联通，移动，电信，）

中国香港，国外拨号VPS。

from pyquery import PyQuery as pqhtml = pq(url=u'http://seam.ustb.edu.cn:8080/jwgl/index.jsp')#现在已经获取了本科教学网首页的htmlclasses = html('.haveclass')#通过类名获取元素#如果你对jQuery熟悉的话，那么你现在肯定明白pyQuery的方便了更多用法参见pyQuery API

好像学会了使用pyQuery就能抓课表了呢，但是，如果你直接用我的源码，肯定会出错。因为还没有登录啊！

所以，在运行这一行抓取正确的代码之前，我们需要模拟登录本科教学网。这个时候，我想起来urllib有模拟post请求的函数，于是我百度了：urllib post。

这是一个最简的模拟post请求例子：

import urllibimport urllib2import cookielibcj = cookielib.CookieJar()opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))opener.addheaders = [('User-agent','Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)')]urllib2.install_opener(opener)req = urllib2.Request("http://seam.ustb.edu.cn:8080/jwgl/Login",urllib.urlencode({"username":"41255029","password":"123456","usertype":"student"}))req.add_header("Referer","http://xxoo.com")resp = urllib2.urlopen(req)#这里面用到了cookielib，我不太清楚，以后慢慢了解吧#还用到了urllib和urllib2，urllib2大概是urllib的扩展包【233想到了三国杀

在这个最简的实例里，用我的校园网账号向登录页面提交表单数据，模拟登录。

现在，我们已经登录了本科教学网，然后结合之前的pyQuery解析html就可以获取网页内的课表了。

html = pq(url=u'http://seam.ustb.edu.cn:8080/jwgl/index.jsp')self.render("index.html",data=html('.haveclass'))

结果展示如图：

最后：

我发现，pyQuery不但用于解析html非常方便，而且可以作为跨域抓取数据的工具，NICE!!!

希望对大家有帮助。

(责任编辑：admin)

上一篇：在GitHub Pages上使用Pelican搭建博客的教程
下一篇：在Python中使用列表生成式的教程

帮助中心: 会员注册; 找回密码; 新闻中心

快捷通道: 域名登录面板; 虚机登录面板; 云主机登录面板

关于我们: 关于我们; 联系我们

联系方式: 售前咨询：17830004266(重庆移动); 企业QQ：383546523

《中华人民共和国工业和信息化部》编号：ICP备00012341号

云官方微信

在线客服

企业QQ:
技术支持：383546523

公司总台电话：17830004266(重庆移动)
售前咨询热线：17830004266(重庆移动)

ADSL拨号VPS包含了中国大陆（联通，移动，电信，） 中国香港，国外拨号VPS。

在Python中使用cookielib和urllib2配合PyQuery抓取网页信息

ADSL拨号VPS包含了中国大陆（联通，移动，电信，）

中国香港，国外拨号VPS。