为了账号安全,请及时绑定邮箱和手机立即绑定

在 Python 中解析给定特定格式的文件名

在 Python 中解析给定特定格式的文件名

萧十郎 2022-07-26 10:13:16
我想创建一个 DataFrame 来解析某些具有特定格式的文件的名称。文件名格式: event_A_(number)_(start datetime)_(end datetime)_(code)_(category).txt日期时间格式:YYYY-MM-DD_HH-MM_SS名称文件示例:event_A_12_2019-01-22_01-35_20_2019-01-22_19-15_13_b123_aa.txt我尝试过使用拆分,然后是简单的正则表达式,然后是合并字符串,但它必须是一种简单的方法。关于如何做到这一点的任何建议?这就是我设法做到的方式,但我相信应该有一种更简单的方法:lst_split = file.split('_')#number = re.findall(r"_A_(..)",file)number = lst_split[2]start_date = lst_split[3]tmp = lst_split[4] + ":" + lst_split[5]start_time = tmp.replace('-',':')end_date = lst_split[6]tmp = lst_split[7] + ":" + lst_split[8]end_time = tmp.replace('-',':')code = lst_split[9]tmp = (lst_split[10]).split('.')category = tmp[0]print(number,start_date,start_time,end_date,end_time,code,category)
查看完整描述

1 回答

?
GCT1015

TA贡献1827条经验 获得超4个赞

您可以使用解包将所有部分放入变量中。然后您将拥有更清晰的代码和更少的转换:


file = "event_A_12_2019-01-22_01-35_20_2019-01-22_19-15_13_b123_aa.txt"

_,_,number,start_date,startHM,startS,end_date,endHM,endS,code,category = file.split("_")

start_time = f"{startHM}:{startS}".replace("-",":")

end_time   = f"{endHM}:{endS}".replace("-",":")

category   = category.strip(".txt")

print(number,start_date,start_time,end_date,end_time,code,category)


# 12 2019-01-22 01:35:20 2019-01-22 19:15:13 b123 aa

请注意,您也可以使用(相当笨拙的)正则表达式将其分解,但您仍然必须对组件进行分隔符替换。


查看完整回答
反对 回复 2022-07-26
  • 1 回答
  • 0 关注
  • 90 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信