香港云主机最佳企业级服务商!

ADSL拨号VPS包含了中国大陆(联通,移动,电信,)

中国香港,国外拨号VPS。

当前位置:云主机 > python >

电信ADSL拨号VPS
联通ADSL拨号VPS
移动ADSL拨号VPS

python实现自动登录人人网并采集信息的方法


时间:2021-12-08 14:52 作者:admin


本文实例讲述了python/' target='_blank'>python实现自动登录人人网并采集信息的方法。分享给大家供大家参考。具体实现方法如下:

#!/usr/bin/Python# -*- coding: utf-8 -*-import sysimport reimport urllib2import urllibimport cookielibclass Renren(object):  def __init__(self):    self.name = self.pwd = self.content = self.domain = self.origURL = ''    self.operate = ''#登录进去的操作对象    self.cj = cookielib.LWPCookieJar()    try:       self.cj.revert('./renren.coockie')     except Exception,e:      print e    self.opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cj))    urllib2.install_opener(self.opener)  def setinfo(self,username,password,domain,origURL):    '''设置用户登录信息'''    self.name = username    self.pwd = password    self.domain = domain    self.origURL = origURL  def login(self):    '''登录人人网'''    params = {      'domain':self.domain,      'origURL':self.origURL,      'email':self.name,       'password':self.pwd}    print 'login.......'    req = urllib2.Request(       'http://www.renren.com/PLogin.do',      urllib.urlencode(params)    )    self.file=urllib2.urlopen(req).read()        newsfeed = open('news.html','w')    try:      newsfeed.write(self.file)    except Exception, e:      newsfeed.close()    self.operate = self.opener.open(req)     print type(self.operate)    print self.operate.geturl()    if self.operate.geturl():       print 'Logged on successfully!'      self.cj.save('./renren.coockie')      self.__viewnewinfo()    else:      print 'Logged on error'  def __viewnewinfo(self):    '''查看好友的更新状态'''    self.__caiinfo()  def __caiinfo(self):    '''采集信息'''        h3patten = re.compile('<article>(.*?)</article>')#匹配范围    apatten = re.compile('<h3.+>(.+)</h3>:')#匹配作者    cpatten = re.compile('</a>(.+)\s')#匹配内容     content = h3patten.findall(self.file)    print len(content)      infocontent = self.operate.readlines()    print type(infocontent)    print 'friend newinfo:'     for i in infocontent:      content = h3patten.findall(i)      if len(content) != 0:        for m in content:          username = apatten.findall(m)          info = cpatten.findall(m)          if len(username) !=0:            print username[0],'说:',info[0]            print '----------------------------------------------'          else:            continueren = Renren()username = 'username'#你的人人网的帐号password = 'password'#你的人人网的密码domain = 'www.renren.com'#人人网的地址origURL = 'http://www.renren.com/home'#人人网登录以后的地址ren.setinfo(username,password,domain,origURL)ren.login()

希望本文所述对大家的Python序设计有所帮助。

(责任编辑:admin)






帮助中心
会员注册
找回密码
新闻中心
快捷通道
域名登录面板
虚机登录面板
云主机登录面板
关于我们
关于我们
联系我们
联系方式

售前咨询:17830004266(重庆移动)

企业QQ:383546523

《中华人民共和国工业和信息化部》 编号:ICP备00012341号

Copyright © 2002 -2018 香港云主机 版权所有
声明:香港云主机品牌标志、品牌吉祥物均已注册商标,版权所有,窃用必究

云官方微信

在线客服

  • 企业QQ: 点击这里给我发消息
  • 技术支持:383546523

  • 公司总台电话:17830004266(重庆移动)
  • 售前咨询热线:17830004266(重庆移动)