我主要在一个数据库上使用 Python,该数据库有 17.000.000 条记录,用于 2.800.000 个唯一 ID。每个 ID 代表运输过程的一个事件,所有实例都有:ID、EVENT、TIMESTAMP(日期时间)。有一个事件通常但不总是开始序列并且有多种结果,即交付、返回等。我的目标是找到每个 ID 所采用的最常见的路径,这意味着事件发生的顺序是什么,并找出流程中的瓶颈。是否有任何可视化工具可以与内置了这种结构的 Python 一起使用?你会建议我如何处理这个问题?谢谢
1 回答
![?](http://img1.sycdn.imooc.com/5333a1920001d36402200220-100-100.jpg)
BIG阳
TA贡献1859条经验 获得超6个赞
这不是 Python 的答案,但鉴于问题,我认为有更好的方法来执行此类分析。
我不知道您是否听说过流程挖掘。但我认为在你的情况下使用它是完美的。基本上,流程挖掘包括分析流程的流程。我使用过不同的工具,其中一些是:
迪斯科
ProM(开源)
塞洛尼斯
基本上,您需要做的就是定义什么是 ID(您已经拥有),然后选择哪些列代表时间戳(您已经拥有)和事件名称(您也拥有)。
这些工具中的任何一个都可以为您提供对流程的完美分析。哪个是最常见的路径,每个事件的平均时间等。如果添加更多属性,它甚至可以根据这些属性返回遵循一条路径或另一条路径的原因。
添加回答
举报
0/150
提交
取消