面向复杂、任务关键数据和机器学习过程的
工作流自动化平台
我看了很多文档,我不明白为什么是“数据和机器学习”。在我看来,它是容器编排(这里是Kubernetes)之上的工作流管理器,其中工作流管理器意味着我可以定义有向无圈图( DAG ),然后将DAG节点部署为容器并运行DAG。
当然,这对“数据和机器学习”很有用,也很重要,但是我也可以将它用于任何其他的微服务DAG。除了特性/细节之外,这与https://airflow.apache.org或其他工作流管理器(其中有很多)有什么不同。还有更专门的工作流管理器用于“数据和机器学习”,例如https://spark.apache.org。
作为一个软件缺陷,我应该记住什么?
发布于 2022-06-17 18:28:15
这是个很好的问题。有一点是正确的,核心是一个Serverless Workflow Orchestrator (无服务器,因为它确实启动了运行代码的基础设施)。是的,它可以用于多种其他情况。对于其他一些系统,如微服务编排,它可能不是最好的工具。
但是,真正使它对ML和数据编排有好处的是
below)
的人员列表)
特性
的工作流。
For Admins
对于真正长时间运行的任务,管理员可以部署管理层,而无需为spot/arm/gpu (具有不同版本等)的tasks
。
积分
本机support
社区
侧重于ML特定特性
路线图
。
希望这能回答你的问题。此外,请加入松弛的社区,并帮助传播这些信息。问更多的问题
https://stackoverflow.com/questions/72657318
复制相似问题