为了账号安全,请及时绑定邮箱和手机立即绑定

对基因组文件的文件操作

对基因组文件的文件操作

芜湖不芜 2021-07-08 17:01:41
我有一个以下格式的基因组文件(大小:~840 MB 和 13801301 行)('genome.txt')>SL3.0ch00AATAATAATAATAATAATAATAATAAATAAATAAATAAATAATAATAATAATAATAATAATAAATAAATAAATAAATAAATAAATAAATAAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAAAAATAATAATAATAATAATAATAATAATAAT>SL3.0ch01TAGAGGATCTTGGAGGAGGTTCATTGCTGCAGATATTCCATTCATCCGATTTCCTCCAAGATGTACCGCGATTTGAGAGAGGTATATTGGTGGGAAGGCAAAGAGAGAGATATTGTTGCCAAGTACCTGAGTTGCCAACAAGTGAAAGTAGAGCACCAAAGTCCTGGAGGTTTGGCTCAAACTTTAGAACTTCTTGAATGGAAGTGGAGATAAATAACATGGACTTTATCACAGGTTTGC>SL3.0ch02ATGTACCGCGATTTGAGAGAGGTATATTGGTGGGAAGGCAAAGAGAGAGATATTGTTGCCAAGTACCTGAGTTGCCAACAAGTGAAAGTAGAGCACCAAAGTCCTGGAGGTTTGGCTCAAACTTTAGAACTTCTTGAATGGAAGTGGAGATAAATAACATGGACTTTATCACAGGTTTGCAAAGATCTCGAAGGCAACATGACTCTAGGTGATTTTCGATAGAATGACAAAGTCATCCCT我想删除换行符和所有标签 '>SL3.0ch00' 以便我在文件中有一个统一的字母字符串(没有任何空格/换行符/标签)。任何帮助表示赞赏。

2 回答

?
紫衣仙女

TA贡献1839条经验 获得超15个赞

使用greptr

grep -v '>' file | tr -d '\n'


查看完整回答
反对 回复 2021-07-13
?
慕后森

TA贡献1802条经验 获得超5个赞

awk 'BEGIN{ORS=""}; !/>/{print}' test.txt

ORS 是输出记录分隔符变量。设置为“”,它删除\n

!/>/ 选择不包含 > 的行


查看完整回答
反对 回复 2021-07-13

添加回答

代码语言

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号