前言我知道dicts/ sets 应该只由于它们的实现而用可散列对象创建/更新,所以当这种代码失败时>>> {{}} # empty dict of empty dictTraceback (most recent call last): File "<input>", line 1, in <module>TypeError: unhashable type: 'dict'没关系,我已经看到大量此类消息。但是如果我想检查一些不可散列的对象是否在set/dict>>> {} in {} # empty dict not in empty dict我也收到错误Traceback (most recent call last): File "<input>", line 1, in <module>TypeError: unhashable type: 'dict'问题这种行为背后的原因是什么?我知道查找和更新可能在逻辑上是相连的(就像在dict.setdefaultmethod 中一样),但它不应该在修改步骤而不是查找中失败吗?也许我有一些我以某种方式处理的可散列的“特殊”值,但其他(可能无法散列) - 在另一个中:SPECIAL_CASES = frozenset(range(10)) | frozenset(range(100, 200))...def process_json(obj): if obj in SPECIAL_CASES: ... # handle special cases else: ... # do something else所以对于给定的查找行为,我被迫使用其中一个选项LBYL方式:检查是否obj是可散列的,然后才检查它是否是其中之一SPECIAL_CASES(这不是很好,因为它基于SPECIAL_CASES结构和查找机制限制,但可以封装在单独的谓词中),EAFP方式:使用某种实用程序进行“安全查找”,例如def safe_contains(dict_or_set, obj): try: return obj in dict_or_set except TypeError: return False使用list/ tuplefor SPECIAL_CASES(不在O(1)查找中)。还是我错过了一些微不足道的东西?
2 回答
慕容708150
TA贡献1831条经验 获得超4个赞
我在 Python 错误跟踪器上发现了这个问题。长话短说:
如果
>>> set([1,2]) in {frozenset([1,2]): 'a'}
返回False
它将在某种程度上违反直觉,因为值相等
>>> set([1,2]) == frozenset([1,2]) True
所以我想我会在可能发生这种情况的地方编写和使用适当的实用程序。
关于错误的根源:在CPython repo dict___contains__
函数(它是一个dict.__contains__
方法实现)中调用PyObject_Hash
函数(对应于hash
函数)-> 对于不可散列的对象(如{}
我们的第一种情况)调用PyObject_HashNotImplemented
函数-> 生成此错误。
jeck猫
TA贡献1909条经验 获得超7个赞
毫无疑问,您已经意识到,集合和字典的内部工作原理非常相似。基本上这个概念是你有键 - 值对(或只是带有集合的键),并且键永远不能改变(不可变)。如果一个对象是可变的,散列就会失去它作为底层数据的唯一标识符的意义。如果你不能判断一个对象是否唯一,一组唯一键的含义就失去了它的唯一性的关键属性。这就是为什么在集合中不允许可变类型和作为字典的键的原因。以你的例子:{} in {} # empty dict not in empty dict
我认为你有一点误解,因为dict.__contains__
只检查字典的键,而不是值。由于您永远不能将 dict 作为键(因为它是可变的),因此这是无效的。
添加回答
举报
0/150
提交
取消