下了一堆html,命名都是数字,想用正则匹配并挨个读取解析于是,只能写到这里import re
#重点在这里
#----------------------------------------------
files = re.findall(r'\d+\.html',这里咋写)
#后面打算这样
for file in files:
html = open(file,'r',encoding='utf-8')
#----------------------------------------------
#现在只能这样
for i in range(0,49999):
try:
html = open(str(i)+'.html','r',encoding='utf-8')
except:
continue这里咋写哪里咋写 啊啊啊。。。
添加回答
举报
0/150
提交
取消