为了账号安全,请及时绑定邮箱和手机立即绑定

python 如何抽取多个指定样本的数据?

python 如何抽取多个指定样本的数据?

喵喵时光机 2019-02-15 11:59:28
现有数据如下(真实情况大概几十万行):比如有另个文件p.txt,里面有一列数,如下:“82400041467896108240004356417597……8240004146757344”我需要抽取数据中第四列为p.txt中的数,该有什么快速的方法吗(方法不限定于pandas)?其实就是个抽样过程,抽指定的样本,第四列为指定文件里的数。现在的想法是在p.txt里循环,然后用pandas读取原始数据,第四列==循环的数就提取出来,是否有更快捷的方法?
查看完整描述

1 回答

?
肥皂起泡泡

TA贡献1829条经验 获得超6个赞

可以考虑用pandas的apply,减去p.txt循环和后继矩阵拼接的步骤。
即读取p.txt里的数据转成一个list例如P,然后用pandas读取原始数据,执行:

df[df[<第四列名>].apply(lambda x: x in P)]


查看完整回答
反对 回复 2019-02-15
  • 1 回答
  • 0 关注
  • 509 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信