为了账号安全,请及时绑定邮箱和手机立即绑定

在拆分它们之前如何避免包含字符串和数字的行?

在拆分它们之前如何避免包含字符串和数字的行?

MMTTMM 2021-11-02 20:17:58
我使用python 3,并且我读取了以几行包含文本和数字的行开始的文件,并且从某一行开始它只是数字列,最初它们在拆分后也被读取为str,后来我将它们转换为浮点数.数据看起来像这样。我还添加了数字样本的链接https://gist.github.com/Farzadtb/b0457223a26704093524e55d9b46b1a8所以问题是,对于阅读,我有两个条件(实际上我希望增加这些条件)使用 try: except 。但这仅适用于划分拆分方法。但在我开始拆分之前,我需要删除包含文本的第一行。我知道我应该使用除了值错误但这真的行不通!f = io.open(file, mode="r", encoding="utf-8")    #f=open(file,"r")    lines=f.readlines()    x=[]    y=[]    z=[]        for i in lines:        try:            a=[i.strip('\n')]            a1=[float(n) for n in a[0].split(',')]            atot.append(a1)            x.append(a1[3])            y.append(a1[2])            z.append(a1[1])        except :             a=[i.split('\n')]             a1=[float(n) for n in a[0].split()]             x.append(a1[3])             y.append(a1[2])             z.append(a1[1])问题是,由于第一行也可以以数字开头,因此第一个参数可能会被拆分并添加到“x”和“y”中,但是我得到了 z 的错误x=[float(i) for i in x]y=[float(i) for i in y]z=[float(i) for i in z]我想到的一个想法是检查该行是否可以无错误地转换为浮动,然后继续拆分,但我不知道该怎么做
查看完整描述

1 回答

?
跃然一笑

TA贡献1826条经验 获得超6个赞

你应该试试这个。此代码使用正则表达式作为一种干净的方式来查找数据。


import pprint

import re


if __name__ == '__main__':

    # pattern to ignore line containing alpha or :

    ignore_pattern = re.compile(r'[^a-zA-Z:]*[a-zA-Z:]')

    # number pattern

    number_pattern = re.compile(r'[-.\d]+')


    matrix = []


    # open the file as readonly

    with open('data.txt', 'r') as file_:


        # iterator over lines

        for line in file_:

            # remove \n and spaces at start and end

            line = line.strip()

            if not ignore_pattern.match(line):


                found = number_pattern.findall(line)

                if found:

                    floats = [float(x) for x in found]

                    matrix.append(floats)


    # print matrix in pretty format

    pp = pprint.PrettyPrinter()

    pp.pprint(matrix)


    # access value by [row][column] starting at 0

    print(matrix[0][2])

对您的样本数据进行了测试。这是 python 脚本的标准输出:


[[-3.1923, 0.6784, -4.6481, -0.0048, 0.3399, -0.2829, 0.0, 24.0477],

 [-3.1827, 0.7048, -4.6257, 0.0017, 0.3435, -0.2855, 0.0, 24.0477],

 [-3.1713, 0.7237, -4.5907, 0.0094, 0.3395, -0.2834, 0.0, 24.0477]]

-4.6481


查看完整回答
反对 回复 2021-11-02
  • 1 回答
  • 0 关注
  • 199 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信