为了账号安全,请及时绑定邮箱和手机立即绑定

使用 biopython 重命名交错的 fastq 标头

使用 biopython 重命名交错的 fastq 标头

小怪兽爱吃肉 2021-06-30 18:57:56
为了便于使用并与另一个下游管道兼容,我正在尝试使用 biopython 更改 fastq 序列 ID 的名称。例如......从看起来像这样的标题开始:@D00602:32:H3LN7BCXX:1:1101:1205:2112 OP:i:1@D00602:32:H3LN7BCXX:1:1101:1205:2112 OP:i:2@D00602:32:H3LN7BCXX:1:1101:1182:2184 OP:i:1@D00602:32:H3LN7BCXX:1:1101:1182:2184 OP:i:2对于看起来像这样的标题:@000000000000001  OP:i:1@000000000000001  OP:i:2@000000000000002  OP:i:1@000000000000002  OP:i:2我有一些代码,但我似乎无法让交替的标题倒计时(即 1、1、2、2、3、3 等)任何帮助,将不胜感激。谢谢。from Bio import SeqIOimport sysFILE = sys.argv[1]#Initialize numbering system at oneCOUNT = 1#Create a new dictionary for new sequence IDsnew_records=[]for seq_record in SeqIO.parse(FILE, "fastq"):        header = '{:0>15}'.format(COUNT)        COUNT += 1        print(header)        seq_record.description = seq_record.description.replace(seq_record.id, "")        seq_record.id = header        new_records.append(seq_record)SeqIO.write(new_records, FILE, "fastq")*seq_record 不包含“OP:i:1”信息
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 187 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信