首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >准备csv文件以进行流程挖掘

准备csv文件以进行流程挖掘
EN

Stack Overflow用户
提问于 2020-07-05 02:08:22
回答 2查看 432关注 0票数 2

希望你做的很好!我正在学习使用'PM4PY‘进行进程挖掘的教程,但是我在csv文件中发现了一些困难,在我的csv文件中,我有以下几列:'id','status','mailID','date'...('status‘与包含一些特定选项的'activity’相同)

我的csv文件包含大量数据。

为了遵循流程挖掘教程,我的专栏中必须有类似于“case:concept:name”的内容……但我不知道我该怎么做

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-01-28 22:58:19

在您的示例中,我假设' ID‘与正常流程挖掘术语中的案例ID相同。类似地,“status”对应于活动ID,“date”对应于时间戳。

最好的选择是在输入到PM4Py之前先读入pandas数据帧。

要详细了解如何做到这一点,请看下面的示例。由于您没有提到csv文件中的所有列,我们假设您当前只有'id','status','date‘作为您的列列表。下面的代码可以适应您拥有的任意数量的列(通过将它们添加到名为cols的列表中):

代码语言:javascript
复制
import pandas as pd
from pm4py.objects.conversion.log import converter as log_converter

path = '' # Enter path to the csv file
data = pd.read_csv(path)
cols = ['case:concept:name','concept:name','time:timestamp']
data.columns = cols
data['time:timestamp'] = pd.to_datetime(data['time:timestamp'])
data['concept:name'] = data['concept:name'].astype(str)

log = log_converter.apply(data, variant=log_converter.Variants.TO_EVENT_LOG)

在这里,我们根据PM4Py包的要求更改了列名及其数据类型。使用log_converter函数将此数据帧转换为事件日志。现在,您可以对此事件日志对象执行常规进程挖掘任务。例如,如果您希望从事件日志创建一个Directly-Follows Graph,则可以使用以下代码行:

代码语言:javascript
复制
from pm4py.algo.discovery.dfg import algorithm as dfg_algorithm

dfg = dfg_algorithm.apply(log)
票数 2
EN

Stack Overflow用户

发布于 2020-09-13 02:50:31

首先,您需要使用pandas导入csv文件,然后转换为事件日志对象,最后可以在pm4py中使用。

参考:https://pm4py.fit.fraunhofer.de/documentation

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62732716

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档