我有一个以下格式的基因组文件(大小:~840 MB 和 13801301 行)('genome.txt')>SL3.0ch00AATAATAATAATAATAATAATAATAAATAAATAAATAAATAATAATAATAATAATAATAATAAATAAATAAATAAATAAATAAATAAATAAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAAAAATAATAATAATAATAATAATAATAATAAT>SL3.0ch01TAGAGGATCTTGGAGGAGGTTCATTGCTGCAGATATTCCATTCATCCGATTTCCTCCAAGATGTACCGCGATTTGAGAGAGGTATATTGGTGGGAAGGCAAAGAGAGAGATATTGTTGCCAAGTACCTGAGTTGCCAACAAGTGAAAGTAGAGCACCAAAGTCCTGGAGGTTTGGCTCAAACTTTAGAACTTCTTGAATGGAAGTGGAGATAAATAACATGGACTTTATCACAGGTTTGC>SL3.0ch02ATGTACCGCGATTTGAGAGAGGTATATTGGTGGGAAGGCAAAGAGAGAGATATTGTTGCCAAGTACCTGAGTTGCCAACAAGTGAAAGTAGAGCACCAAAGTCCTGGAGGTTTGGCTCAAACTTTAGAACTTCTTGAATGGAAGTGGAGATAAATAACATGGACTTTATCACAGGTTTGCAAAGATCTCGAAGGCAACATGACTCTAGGTGATTTTCGATAGAATGACAAAGTCATCCCT我想删除换行符和所有标签 '>SL3.0ch00' 以便我在文件中有一个统一的字母字符串(没有任何空格/换行符/标签)。任何帮助表示赞赏。
2 回答

慕后森
TA贡献1802条经验 获得超5个赞
awk 'BEGIN{ORS=""}; !/>/{print}' test.txt
ORS 是输出记录分隔符变量。设置为“”,它删除\n
!/>/ 选择不包含 > 的行
没有找到匹配的内容?试试慕课网站内搜索吧
添加回答
举报
0/150
提交
取消