为了账号安全,请及时绑定邮箱和手机立即绑定

为什么这个嵌套的 for 循环在第二个循环中迭代了两次,之后就完全没有了?

为什么这个嵌套的 for 循环在第二个循环中迭代了两次,之后就完全没有了?

墨色风雨 2022-01-11 16:09:20
我试图通过下面定义的函数运行它来处理一些数据。它似乎可以很好地运行程序,但是循环不会迭代我期望的次数。我将 return 语句放在哪里似乎并不重要,只要它在函数内部而不是在 if 语句之下。我尝试在每个 for 循环下独立编写行,并在每种情况下写入预期的行数。def _ManhattanDistance(x,y):    a = 0    for i in range(0,len(x)):        a += abs(float(x[i])-float(y[i]))    return adef _CabFare(x,y,z):    with open(x, 'r') as f:        with open(y, 'r') as g:            with open(z, 'wb') as h:                reader_1 = csv.reader(f)                reader_2 = csv.reader(g)                writer = csv.writer(h)                for row_b in reader_2:                    for row_a in reader_1:                        if _ManhattanDistance(row_a,row_b) > 0:                            writer.writerow(row_a)                            writer.writerow(row_b)                return作为参考,给定我的输入 reader_1 应该有 200 行,而 reader_2 应该有 17145 行。由于我们的包含阈值为零,我预计输出文件中有 17145*200 = 3429000 行——我得到的是一个 400 行的输出。
查看完整描述

2 回答

?
牛魔王的故事

TA贡献1830条经验 获得超3个赞

这似乎有效:


from itertools import product


def _CabFare(x,y,z):

    with open(x, 'r') as f, open(y, 'r') as g, open(z, 'wb') as h:

        writer = csv.writer(h)

        for row_a, row_b in product(csv.reader(f), csv.reader(g)):

            if _ManhattanDistance(row_a, row_b) > 0:

                writer.writerow(row_a)

                writer.writerow(row_b)

速度较慢,但内存占用较少:


def _CabFare(x,y,z):

    with open(x, 'r') as f, open(z, 'wb') as h:

        writer = csv.writer(h)

        for row_a in csv.reader(f):

            with open(y, 'r') as g:

                for row_b in csv.reader(g):

                    if _ManhattanDistance(row_a, row_b) > 0:

                        writer.writerow(row_a)

                        writer.writerow(row_b)


查看完整回答
反对 回复 2022-01-11
?
慕标琳琳

TA贡献1830条经验 获得超9个赞

reader是一个有状态的迭代器。一旦你用尽它,它就完成了,你需要重新打开它才能再次迭代文件:


def _CabFare(x,y,z):

    with open(x, 'r') as f:

        with open(y, 'r') as g:

            with open(z, 'wb') as h:

                reader_2 = csv.reader(g)

                writer = csv.writer(h)

                for row_b in reader_2:

                    reader_1 = csv.reader(f) # Reopen reader_1 for each iteration

                    for row_a in reader_1:

                        if _ManhattanDistance(row_a,row_b) > 0:

                            writer.writerow(row_a)

                            writer.writerow(row_b)


查看完整回答
反对 回复 2022-01-11
  • 2 回答
  • 0 关注
  • 281 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信