为了账号安全,请及时绑定邮箱和手机立即绑定

python使用glob模块访问选择性文件

python使用glob模块访问选择性文件

蓝山帝景 2021-03-05 10:08:01
我有一个二进制文件集合,其名称如下:d010-recomb.bind011-recomb.bin.......................................d100-recomb.bin使用python glob模块,我可以访问文件夹中的所有文件,并可以对这些文件进行进一步处理:import globbinary = sorted(glob.glob('C:/Users/Desktop/bin/*.bin')) 我还可以对要访问的文件使用一些条件:例如,如果我使用以下代码,则可以访问从d010-recomb.bin到d019-recomb.bin的所有文件binary = sorted(glob.glob('C:/Users/Desktop/bin/d01*.bin'))但是使用此标准,我无法访问d015至d025之类的文件。请告诉我我该怎么做才能访问这些文件。
查看完整描述

3 回答

?
莫回无

TA贡献1865条经验 获得超7个赞

之后过滤列表;将文件名部分转到int或创建要包含的字符串范围:


included = {'d{:03d}'.format(i) for i in range(15, 26)}  # a set


binary = sorted(f for f in glob.glob('C:/Users/Desktop/bin/*.bin') if f[21:25] in included) 

上面的代码生成所述串'd015' 通过对'd025'作为一组进行快速测试籍串,然后测试前4个字符针对该组中的每个文件的; 因为glob()返回整个文件名,所以我们将其切掉了。


对于可变路径,我将基于路径存储切片偏移量以提高速度:


pattern = 'C:/Users/Desktop/bin/*.bin'

included = {'d{:03d}'.format(i) for i in range(15, 26)}  # a set

offset = len(os.path.dirname(pattern)) + 1


binary = sorted(f for f in glob.glob(pattern) if f[offset:offset + 4] in included) 

后者的演示:


$ mkdir test

$ touch test/d014-recomb.bin

$ touch test/d015-recomb.bin

$ touch test/d017-recomb.bin

$ touch test/d018-recomb.bin

$ fg

bin/python2.7

>>> import os, glob

>>> pattern = '/tmp/stackoverflow/test/*.bin'

>>> included = {'d{:03d}'.format(i) for i in range(15, 26)}  # a set

>>> offset = len(os.path.dirname(pattern)) + 1

>>> sorted(f for f in glob.glob(pattern) if f[offset:offset + 4] in included)

['/tmp/stackoverflow/test/d015-recomb.bin', '/tmp/stackoverflow/test/d017-recomb.bin', '/tmp/stackoverflow/test/d018-recomb.bin']



查看完整回答
反对 回复 2021-03-27
?
幕布斯6054654

TA贡献1876条经验 获得超7个赞

您可以使用以下方法过滤列表:


def filter_path(path,l,r):

    i = int(os.path.basename(path)[1:4])

    if (i >= l) and (i <= r):

        return True

    return False


result = [i for i in binary if filter_path(i,19,31)]

如果您对目录中的元素数量有100%的信心,则可以:


result = binary[19:30]

或者,对数据进行排序后,您可能会发现第一个索引和最后一个索引以及[1] [2]:


l = binary.find('C:/Users/Desktop/bin/d015.bin')

r = binary.find('C:/Users/Desktop/bin/d023.bin')

result = binary[l:r+1]


查看完整回答
反对 回复 2021-03-27
?
慕莱坞森

TA贡献1810条经验 获得超4个赞

您可能必须手动添加此限制,因为无法通过全局模式来实现。


如果您完全知道文件名的构建方式,则可以


import os

for i in range(19, 34): # 19 to 33

    filename = "d%03d-recomb.bin" % i

    if os.path.exists(os.path.join('C:/Users/Desktop/bin', filename)):

        print filename


查看完整回答
反对 回复 2021-03-27
  • 3 回答
  • 0 关注
  • 198 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信