首页猿问删除包含相同字母超过3次的行

删除包含相同字母超过3次的行

Python

30秒到达战场 2023-08-22 10:44:52

我有这段代码，如果行 3 次包含相同的字母，则删除行。如果字母重复超过 3 次（分隔），我需要它来删除该行。3次（分开）我的意思是例如这一行BAABAAG。请注意，这一行包含该字母A四次，但我的代码没有删除它，因为这四个字母A并不彼此相邻。bad_words = ['AAA','BBB','CCC','DDD','EEE','FFF','GGG','HHH','III','JJJ','KKK','LLL','MMM','NNN','OOO','PPP','QQQ','RRR','SSS','TTT','UUU','VVV','WWW','XXX','YYY','ZZZ','111','222','333','444','555','666','777','888','999','000']with open('7.csv') as oldfile, open('new7.csv', 'w') as newfile: for line in oldfile: if not any(bad_word in line for bad_word in bad_words): newfile.write(line)文件样本：BAABAABBAABAACBAABAADBAABAAEBAABAAFBAABAAGBAABAAHBAABAAIBAABAAJBAABAAKBAABAALBAABAAMBAABAANBAABAAOBAABAAPBAABAAQ

查看完整描述

4 回答

慕婉清6462132

TA贡献1804条经验获得超2个赞

无需显式创建bad_words列表，您repeater也可以将其设置为变量

repeater = 3

newlist = []

with open('input.txt') as f:

x = f.readlines()

for val in x:

word = val.split('\n')[0]

flag = True

for letter in word:

if letter.upper() * repeater in word:

flag = False

break

if flag:

newlist.append(word)

newlist = list(set(newlist))

with open('output.txt', mode='w', encoding='utf-8') as newfile:

for value in newlist:

newfile.writelines(value+"\n")

反对回复 2023-08-22

四季花海

TA贡献1811条经验获得超5个赞

您可以创建一个函数来检查某个字符是否出现超过 3 次，然后在代码中调用它：

def letter_count(str):

counts = dict()

for l in str:

if l in counts:

counts[l] += 1

else:

counts[l] = 1

counts[max(counts, key=lambda x : counts[x])]

return counts[max(counts, key=lambda x : counts[x])] > 3

并在您的代码中这样调用它：

with open('7.csv') as oldfile, open('new7.csv', 'w') as newfile:

for line in oldfile:

if if(letter_count(line)):

newfile.write(line)

反对回复 2023-08-22

慕妹3242003

TA贡献1824条经验获得超6个赞

您可以使用 aCounter检查每行中不同字母的频率，然后仅在它们未通过阈值时才写入此行：

from collections import Counter

threshold = 3

with open('7.csv') as oldfile, open('new7.csv', 'w') as newfile:

for line in oldfile:

counts = Counter(line)

if all(count < threshold for count in counts.values()):

newfile.write(line)

这使用该all()函数来确保没有字母超过阈值。

反对回复 2023-08-22

神不在的星期二

TA贡献1963条经验获得超6个赞

使用单个字符而不是三元组和的列表string.count()。制作一个小函数来封装过滤逻辑可能也是一个不错的选择。

def f(line, chars, limit):

for char in chars:

if line.count(char) > limit:

return False

return True

bad_chars = ['A','B', ...]

with open('7.csv', 'r') as oldfile, open('new7.csv', 'w') as newfile:

for line in oldfile:

if f(line, bad_chars, 3):

newfile.write(line)

反对回复 2023-08-22

4 回答
0 关注
4098 浏览

关注

添加回答

0/150

提交

取消

热搜

最近搜索清空

删除包含相同字母超过3次的行

删除包含相同字母超过3次的行

4 回答

添加回答