假设我想要对文档进行注释。每个文档都可以使用多个标签进行注释。在这个例子中,我有 2 个注释器(a 和 b),他们每个都标记了两个文档。from sklearn.metrics import cohen_kappa_scoreannotator_a = [ ["a","b","c"], ["d","e"]]annotator_b = [ ["b","c"], ["f"]]Annotator_a 用标签 a、b 和 c 标记文档 1。Annotator_b 用标签 b 和 c 标记文档 1。我尝试使用以下方法计算注释者协议:cohen_kappa_score(annotator_a, annotator_b)但这会导致错误:ValueError: You appear to be using a legacy multi-label data representation. Sequence of sequences are no longer supported; use a binary array or sparse matrix instead.关于如何计算此集合上的注释者协议的任何想法?
添加回答
举报
0/150
提交
取消