"""
posts为文章dict,里面保存着文章的相关信息,在这里主要是提取tags标签
将从posts中提取的tags保存到allkey的列表中,
格式如下:
allkey=['linux','windows','xp,windows','linux,debian','centos','hello']
想统计linux,windows,xp等元素的次数,
但是像这么写,如果posts里数据过多,导致运行时间就太漫长了
"""
allkey = axxkey = []
mbkey = {}
for xkey in posts:
allkey.append(xkey['tags'].lower())
for xxkey in allkey:
if ',' not in xxkey:
axxkey.append(xxkey)
else:
y=[]
y=xxkey.split(',')
for j in y:
axxkey.append(j)
for i in axxkey:
mbkey[i] = mbkey.get(i, 0)+1##update 尴尬啊我重新描述一下:# 现有一个list,其格式如下
list=['中文','Linux,中文','中文,Debian,Linux','Centos','Debian,centos']
大概是这样,len(list)>=50
然后想统计其中所有元素如中文、linux,Debian,centos等的数目,然后存到dict字典中,尽可能的简洁
添加回答
举报
0/150
提交
取消