1 回答
TA贡献1786条经验 获得超13个赞
如果我对你的理解是正确的,你可以做下面这样的事情。请注意,xpath在这里不起作用,正则表达式是有问题的。因此,我认为,最干净的方法是使用字符串操作和字典。
对于第一个:
arr = """your first html example"
splt_str = 'var productDetail = {'
trg = arr.split(splt_str)[1].split('}')[0].split(',')
stf = {}
for t in trg:
entry = t.strip().replace("'","").split(':')
stf[entry[0]]= entry[1]
for k, v in stf.items():
print(k, v)
输出:
id 4002021
name Tommy string
category Collection Brand Basics
brand
price 8.31
variant
对于第二行,将前两行更改为:
arr = """your second html example"
splt_str = 'var AWACP_CONFIG = {'
输出:
mageVersion 1.9.3.1
useProgress 1
popupForAllProducts 0
addProductConfirmationEnabled 1
removeProductConfirmationEnabled 1
dialogsVAlign center
cartAnimation opacity
addProductCounterBeginFrom 0
removeProductCounterBeginFrom 0
hasFileOption false
添加回答
举报