由于我有一个很大的文件(几个 GB),我不想将整个文件加载到内存中,而是使用 *generators 逐行加载。我的文件是这样的:# millions of lines....................................keyw 288992233 121 ee 0o90 jjsl2321 232 qq 0kj9 jkslkeyw 289003433 124 rr 8hu9 jkas4532 343 ww 3ko9 aslk1098 115 uy oiw8 reklkeyw 29891....................................# millions more到目前为止,我在这里找到了类似的答案。但我迷失了如何实施它。因为 ans 有特定的标识符Startand Stop,而我的文件有一个带有相同关键字的增量编号。我想在这方面得到一些帮助。
1 回答
婷婷同学_
TA贡献1844条经验 获得超8个赞
如果您想调整该答案,这可能会有所帮助:
bucket = []
for line in infile:
if line.split()[0] == 'keyw':
for strings in bucket:
outfile.write( strings + '\n')
bucket = []
continue
bucket.append(line.strip())
添加回答
举报
0/150
提交
取消