香港云主机最佳企业级服务商!

ADSL拨号VPS包含了中国大陆(联通,移动,电信,)

中国香港,国外拨号VPS。

当前位置:云主机 > python >

电信ADSL拨号VPS
联通ADSL拨号VPS
移动ADSL拨号VPS

python爬虫入门教程之点点美女图片爬虫代码分享


时间:2021-11-09 10:23 作者:admin610456


继续鼓捣爬虫,今天贴出一个代码,爬取点点网「美女」标签下的图片,原图。

# -*- coding: utf-8 -*- #--------------------------------------- #  程序:点点美女图片爬虫 #  版本:0.2 #  作者:zippera #  日期:2013-07-26 #  语言:python/' target='_blank'>python 2.7 #  说明:能设置下载的页数 #---------------------------------------  import urllib2import urllibimport re   pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="  count = 1 while count < 2:   print "Page " + str(count) + "\n"  myurl = nexturl1 + str(count)  myres = urllib2.urlopen(myurl)  mypage = myres.read()  ucpage = mypage.decode("utf-8") #转码   mat = pat.findall(ucpage)           if len(mat):    cnt = 1    for item in mat:      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"      cnt += 1      fnp = re.compile('(\w{10}\.\w+)$')      fnr = fnp.findall(item)      if fnr:        fname = fnr[0]        urllib.urlretrieve(item, fname)      else:    print "no data"      count += 1

使用方法:新建一个文件夹,把代码保存为name.py文件,运行Python name.py就可以把图片下载到文件夹。

(责任编辑:admin)






帮助中心
会员注册
找回密码
新闻中心
快捷通道
域名登录面板
虚机登录面板
云主机登录面板
关于我们
关于我们
联系我们
联系方式

售前咨询:17830004266(重庆移动)

企业QQ:383546523

《中华人民共和国工业和信息化部》 编号:ICP备00012341号

Copyright © 2002 -2018 香港云主机 版权所有
声明:香港云主机品牌标志、品牌吉祥物均已注册商标,版权所有,窃用必究

云官方微信

在线客服

  • 企业QQ: 点击这里给我发消息
  • 技术支持:383546523

  • 公司总台电话:17830004266(重庆移动)
  • 售前咨询热线:17830004266(重庆移动)