为了账号安全,请及时绑定邮箱和手机立即绑定

r语言,csv数据,提取特定行

sampleTCGA-CA-5256-01TCGA-AZ-6599-11TCGA-AA-3655-01TCGA-A6-6137-01TCGA-CK-4952-01TCGA-A6-5657-01TCGA-AD-6963-01TCGA-AA-3663-11
ARHGEF10L10.161611.121211.024511.057610.56610.418910.863511.0543
HIF3A3.71722.34372.08586.07591.95065.47774.46348.4492
RNF17000.549500000

上面第一行显示样本名字,样本名字最后的两个数字:01代表癌组织,11代表正常组织,有办法只提取正常组织的列吗?万分感谢

正在回答

1 回答

刚学R不太会,用python写的把csv文件里你的要求写到一个新的csv文集里


import re

input_file=open('yourfile.csv')

output_file=open('result.csv','w')

table=[]

for line in input_file:

    line=line.strip().split(',')

    table.append(line)


new_table=zip(*table)

pattern=re.compile(".*-11")

result_table=[]

for line in new_table:

    match=pattern.match(line[0])

    if match:

        result_table.append(line)


result_table=zip(*result_table)

for line in result_table:

    line=','.join(line)+'\n'

    output_file.write(line)


output_file.close()

input_file.close()


0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
R语言基础
  • 参与学习       79669    人
  • 解答问题       262    个

本R语言基础教程,教你如何在R中操纵自己数据,快速入门

进入课程

r语言,csv数据,提取特定行

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信