为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用 Python 构建基于时间戳出现的序列?

如何使用 Python 构建基于时间戳出现的序列?

幕布斯7119047 2021-11-16 15:28:58
我主要在一个数据库上使用 Python,该数据库有 17.000.000 条记录,用于 2.800.000 个唯一 ID。每个 ID 代表运输过程的一个事件,所有实例都有:ID、EVENT、TIMESTAMP(日期时间)。有一个事件通常但不总是开始序列并且有多种结果,即交付、返回等。我的目标是找到每个 ID 所采用的最常见的路径,这意味着事件发生的顺序是什么,并找出流程中的瓶颈。是否有任何可视化工具可以与内置了这种结构的 Python 一起使用?你会建议我如何处理这个问题?谢谢
查看完整描述

1 回答

?
BIG阳

TA贡献1859条经验 获得超6个赞

这不是 Python 的答案,但鉴于问题,我认为有更好的方法来执行此类分析。

我不知道您是否听说过流程挖掘。但我认为在你的情况下使用它是完美的。基本上,流程挖掘包括分析流程的流程。我使用过不同的工具,其中一些是:

  • 迪斯科

  • ProM(开源)

  • 塞洛尼斯

基本上,您需要做的就是定义什么是 ID(您已经拥有),然后选择哪些列代表时间戳(您已经拥有)和事件名称(您也拥有)。

这些工具中的任何一个都可以为您提供对流程的完美分析。哪个是最常见的路径,每个事件的平均时间等。如果添加更多属性,它甚至可以根据这些属性返回遵循一条路径或另一条路径的原因。


查看完整回答
反对 回复 2021-11-16
  • 1 回答
  • 0 关注
  • 194 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信