为了账号安全,请及时绑定邮箱和手机立即绑定

对基因组文件的文件操作

对基因组文件的文件操作

芜湖不芜 2021-07-08 17:01:41
我有一个以下格式的基因组文件(大小:~840 MB 和 13801301 行)('genome.txt')>SL3.0ch00AATAATAATAATAATAATAATAATAAATAAATAAATAAATAATAATAATAATAATAATAATAAATAAATAAATAAATAAATAAATAAATAAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAAAAATAATAATAATAATAATAATAATAATAAT>SL3.0ch01TAGAGGATCTTGGAGGAGGTTCATTGCTGCAGATATTCCATTCATCCGATTTCCTCCAAGATGTACCGCGATTTGAGAGAGGTATATTGGTGGGAAGGCAAAGAGAGAGATATTGTTGCCAAGTACCTGAGTTGCCAACAAGTGAAAGTAGAGCACCAAAGTCCTGGAGGTTTGGCTCAAACTTTAGAACTTCTTGAATGGAAGTGGAGATAAATAACATGGACTTTATCACAGGTTTGC>SL3.0ch02ATGTACCGCGATTTGAGAGAGGTATATTGGTGGGAAGGCAAAGAGAGAGATATTGTTGCCAAGTACCTGAGTTGCCAACAAGTGAAAGTAGAGCACCAAAGTCCTGGAGGTTTGGCTCAAACTTTAGAACTTCTTGAATGGAAGTGGAGATAAATAACATGGACTTTATCACAGGTTTGCAAAGATCTCGAAGGCAACATGACTCTAGGTGATTTTCGATAGAATGACAAAGTCATCCCT我想删除换行符和所有标签 '>SL3.0ch00' 以便我在文件中有一个统一的字母字符串(没有任何空格/换行符/标签)。任何帮助表示赞赏。
查看完整描述

2 回答

?
紫衣仙女

TA贡献1839条经验 获得超15个赞

使用greptr

grep -v '>' file | tr -d '\n'


查看完整回答
反对 回复 2021-07-13
?
慕后森

TA贡献1802条经验 获得超5个赞

awk 'BEGIN{ORS=""}; !/>/{print}' test.txt

ORS 是输出记录分隔符变量。设置为“”,它删除\n

!/>/ 选择不包含 > 的行


查看完整回答
反对 回复 2021-07-13
  • 2 回答
  • 0 关注
  • 131 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信