香港云主机最佳企业级服务商!

ADSL拨号VPS包含了中国大陆(联通,移动,电信,)

中国香港,国外拨号VPS。

当前位置:云主机 > python >

电信ADSL拨号VPS
联通ADSL拨号VPS
移动ADSL拨号VPS

python实现下载指定网址所有图片的方法


时间:2021-12-08 14:55 作者:admin610456


本文实例讲述了python/' target='_blank'>python实现下载指定网址所有图片的方法。分享给大家供大家参考。具体实现方法如下:

#coding=utf-8#download pictures of the url#useage: Python downpicture.py www.baidu.comimport osimport sysfrom html.parser import HTMLParserfrom urllib.request import urlopenfrom urllib.parse import urlparsedef getpicname(path):  '''  retrive filename of url    '''  if os.path.splitext(path)[1] == '':    return None  pr=urlparse(path)  path='http://'+pr[1]+pr[2]  return os.path.split(path)[1]def saveimgto(path, urls):  '''  save img of url to local path  '''  if not os.path.isdir(path):    print('path is invalid')    sys.exit()  else:    for url in urls:      of=open(os.path.join(path, getpicname(url)), 'w+b')      q=urlopen(url)      of.write(q.read())      q.close()      of.close()class myhtmlparser(HTMLParser):  '''put all src of img into urls'''  def __init__(self):    HTMLParser.__init__(self)    self.urls=list()    self.num=0  def handle_starttag(self, tag, attr):    if tag.lower() == 'img':      srcs=[u[1] for u in attr if u[0].lower() == 'src']      self.urls.extend(srcs)      self.num = self.num+1if __name__ == '__main__':  url=sys.argv[1]  if not url.startswith('http://'):    url='http://' + sys.argv[1]  parseresult=urlparse(url)  domain='http://' + parseresult[1]  q=urlopen(url)  content=q.read().decode('utf-8', 'ignore')  q.close()  myparser=myhtmlparser()  myparser.feed(content)  for u in myparser.urls:    if (u.startswith('//')):      myparser.urls[myparser.urls.index(u)]= 'http:'+u    elif u.startswith('/'):      myparser.urls[myparser.urls.index(u)]= domain+u  saveimgto(r'D:\python\song', myparser.urls)  print('num of download pictures is {}'.format(myparser.num))

运行结果如下:

num of download pictures is 19

希望本文所述对大家的Python程序设计有所帮助。

(责任编辑:admin)






帮助中心
会员注册
找回密码
新闻中心
快捷通道
域名登录面板
虚机登录面板
云主机登录面板
关于我们
关于我们
联系我们
联系方式

售前咨询:17830004266(重庆移动)

企业QQ:383546523

《中华人民共和国工业和信息化部》 编号:ICP备00012341号

Copyright © 2002 -2018 香港云主机 版权所有
声明:香港云主机品牌标志、品牌吉祥物均已注册商标,版权所有,窃用必究

云官方微信

在线客服

  • 企业QQ: 点击这里给我发消息
  • 技术支持:383546523

  • 公司总台电话:17830004266(重庆移动)
  • 售前咨询热线:17830004266(重庆移动)