香港云主机最佳企业级服务商!

ADSL拨号VPS包含了中国大陆(联通,移动,电信,)

中国香港,国外拨号VPS。

当前位置:云主机 > python >

电信ADSL拨号VPS
联通ADSL拨号VPS
移动ADSL拨号VPS

python 高效去重复 支持GB级别大文件的示例代码


时间:2022-02-08 17:49 作者:admin


如下所示:

#coding=utf-8 import sys, re, os def getDictList(dict):  regx = '''[\w\~`\!\@\#\$\%\^\&\*\(\)\_\-\+\=\[\]\{\}\:\;\,\.\/\<\>\?]+'''  with open(dict) as f:    data = f.read()    return re.findall(regx, data) def rmdp(dictList):  return list(set(dictList)) def fileSave(dictRmdp, out):  with open(out, 'a') as f:    for line in dictRmdp:      f.write(line + '\n') def main():  try:    dict = sys.argv[1].strip()    out = sys.argv[2].strip()  except Exception, e:    print 'error:', e    me = os.path.basename(__file__)    print 'usage: %s <input> <output>' %me    print 'example: %s dict.txt dict_rmdp.txt' %me    exit()   dictList = getDictList(dict)  dictRmdp = rmdp(dictList)  fileSave(dictRmdp, out)   if __name__ == '__main__':  main()

以上这篇python/' target='_blank'>python 高效去重复 支持GB级别大文件的示例代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

(责任编辑:admin)






帮助中心
会员注册
找回密码
新闻中心
快捷通道
域名登录面板
虚机登录面板
云主机登录面板
关于我们
关于我们
联系我们
联系方式

售前咨询:17830004266(重庆移动)

企业QQ:383546523

《中华人民共和国工业和信息化部》 编号:ICP备00012341号

Copyright © 2002 -2018 香港云主机 版权所有
声明:香港云主机品牌标志、品牌吉祥物均已注册商标,版权所有,窃用必究

云官方微信

在线客服

  • 企业QQ: 点击这里给我发消息
  • 技术支持:383546523

  • 公司总台电话:17830004266(重庆移动)
  • 售前咨询热线:17830004266(重庆移动)