Metaflow背后的想法是使Netflix数据科学家能够及早查看原模型是否会在生产中失败,从而使他们能够解决所有问题并理想地加快部署时间。 Netflix在2月份透露,Metaflow已将部署时间从四个月缩短到了仅仅7天。 在S3中对代码进行快照的功能使Metaflow能够实现自动版本控制和实验跟踪,因此开发人员可以安全地检查和恢复Metaflow的执行情况。 ? Metaflow还与基于AWS容器的计算平台Batch集成。Netflix 认为,AWS上的Metaflow可以让开发人员提高在笔记本电脑上进行开发的速度,同时可以在云中使用更深的计算资源。 Metaflow使得不必在每种状态下都对代码或库进行更改,从而使在本地和远程执行模式之间轻松地来回移动,这反过来又使故障排除更加容易。
今天,我们很高兴地宣布 Metaflow 原生支持 Kubernetes 路径,作为 AWS 原生路径的同等替代: 值得强调的是,Kubernetes 的好处针对的是工程师,而不是使用 Metaflow 参考资料 [1] Metaflow: https://docs.metaflow.org/ [2] 将计算扩展到 Kubernetes 集群: https://docs.metaflow.org/metaflow [5] 本地构建和测试工作流: https://docs.metaflow.org/metaflow/basics [6] 云基础设施集成: https://outerbounds.com/docs/ admin [7] 更大规模的数据和计算: https://docs.metaflow.org/metaflow/scaling-out-and-up [8] 部署到生产级工作流编排系统: https: //docs.metaflow.org/going-to-production-with-metaflow/scheduling-metaflow-flows [9] Netflix 在 2019 年开源
接下来以MetaFlow为例讲解如何构建高度自动化可观测性平台。 首先简单了解一下孕育MetaFlow出生的土壤。 向上MetaFlow提供一个统一的SQL接口,使得开发者能快速将MetaFlow融入到已有的可观测性平台中。 MetaFlow的GitHub地址:https://github.com/metaflowys/metaflow。 02 MetaFlow的Agent和Server MetaFlow的架构其实非常简单,简单到只有一个Agent和一个Server,分别是数据采集组件和数据存储查询组件。 可以依赖于MetaFlow的AutoTagging技术。
寻找图 G 的等价图 G' 的过程在一个名为 MetaFlow 的系统中实现,其可被用于优化已有的深度学习框架的 DNN 计算图,即 MetaFlow 是用于 DNN 的宽松化图替代优化器。 蓝线是没使用 MetaFlow 的优化图的三个基准框架得到的最佳结果,红线是 MetaFlow 结果。 ? 图 2:MetaFlow、TensorFlow、TensorFlow XLA 和 TensorRT 的端到端性能比较 可以看到,MetaFlow 速度更快,优于已有的深度学习推理引擎。 表 2:MetaFlow 和 TensorRT 在不同指标上的性能比较 相比于 TensorRT,MetaFlow 能够减少整体的内存访问量以及核启动的数量。 子图性能指标是用于确定 MetaFlow 能否提升 DNN 中单个子图的性能。实验中测试比较了不同的设备,以确定给定一个输入图时,MetaFlow 能否在不同设备上发现不同的优化图。
Metaflow 像 Kubeflow 和 Metaflow 这样的基础设施抽象工具,旨在将运行 Airflow 或 Argo 通常需要的基础设施模板代码抽象出来,帮助你在开发和生产环境中运行工作流。 从用户体验的角度来看,我认为 Metaflow 更胜一筹。 在 Metaflow 中,你可以使用 Python 装饰器@conda来指定每个步骤的需求——所需的库、内存和计算资源需求——Metaflow 将自动创建一个满足所有这些要求的容器来执行该步骤。 Metaflow 让你可以在同一个 notebook/ 脚本中实现开发和生产环境的无缝衔接。 务必试一下(Kubeflow 比较复杂,但 Metaflow 只需 5 分钟就能上手)。
减少 Pandas 的内存使用量#2:有损压缩 链接: https://pythonspeed.com/articles/pandas-reduce-memory-lossy/ 有趣的项目,工具和库 Metaflow 链接: https://metaflow.org/ 在 Netflix 上开发的用于现实数据科学的框架。 Metaflow 使构建和管理现实中的数据科学项目变得容易快捷。
Metaflow Metaflow 是一个对用户友好的 Python 库和后端服务,可以帮助数据科学家和工程师构建和管理可用于生产的数据处理、机器学习训练及推理的工作流。 Metaflow 提供一系列 Python API,将代码组织为由步骤组成的有向图。每一个步骤都可以灵活配置,例如其所需的计算和存储资源。 Metaflow 的价值主张是其惯用的 Python 库的简洁性:它与构建和运行时的基础设施完全集成,以支持在本地和规模化的生产环境中运行数据工程和科学任务。 在撰写本条目时,Metaflow 和 AWS 服务高度集成,例如使用 S3 来做数据存储,step functions 来做编排。除 Python 以外,Metaflow 还支持 R 语言。 如果你正在 AWS 上构建和部署生产环境的机器学习和数据处理流水线,作为一个轻量级的全栈框架,Metaflow 可以替代例如 MLflow 这类更复杂的平台。
六、metanoindex + follow 为了防止集合转移权重,我们可以在页面上使用metaindex 和 metaflow,这样页面就不包括在内,而是可以流出权重,这是一个不错的办法。
适用于:在Kubernetes上运行和管理AI工作流程2.MLflow特点: 用于管理机器学习生命周期的平台 提供实验跟踪、模型打包、部署等功能 支持多种机器学习框架 适用于:跟踪和管理机器学习实验3.Metaflow
六、metanoindex + follow 为了防止集合转移权重,我们可以在页面上使用metaindex 和 metaflow,这样页面就不包括在内,而是可以流出权重,这是一个不错的办法。
第一章: 介绍 第二章: 数据科学的工具链 第三章: 介绍Metaflow 第四章: 计算层的扩展 第五章: 实践可扩展和性能 第六章: 进入生产阶段 第七章: 处理数据 第八章: 使用和运作模式 第九章
继续之前,也可以阅读这个 Tensorflow 小入门: https://blog.metaflow.fr/tensorflow-a-primer-4b3fa0978be3#.wxlmweb8h 你有必要了解这些信息 原文链接:https://blog.metaflow.fr/tensorflow-saving-restoring-and-mixing-multiple-models-c4c94d5d7125#.lms6atw2p
选自MetaFlow 作者:Morgan 机器之心编译 参与:李亚洲、蒋思源 在这篇文章中,作者根据自己的经验为 TensorFlow 初学者给出了设计文件、文件夹架构的建议。 原文链接:https://blog.metaflow.fr/tensorflow-a-proposal-of-good-practices-for-files-folders-and-models-architecture-f23171501ae3
medium.com/@erikhallstrm) https://medium.com/@erikhallstrm/hello-world-tensorflow-649b15aed18c Tensorflow入门(metaflow.fr ) https://blog.metaflow.fr/tensorflow-a-primer-4b3fa0978be3 Tensorflow实现RNNs (wildml.com) http://www.wildml.com
medium.com/@erikhallstrm) https://medium.com/@erikhallstrm/hello-world-tensorflow-649b15aed18c Tensorflow入门(metaflow.fr ) https://blog.metaflow.fr/tensorflow-a-primer-4b3fa0978be3 Tensorflow实现RNNs (wildml.com) http://www.wildml.com
tensorflow.org) Introduction to TensorFlow — CPU vs GPU (medium.com/@erikhallstrm) TensorFlow: A primer (metaflow.fr
需代码) ✅ ✅ 适用规模 大型企业 中大型 中小型 AI 项目 选型建议: 超大规模、复杂调度 → Celery / Apache Airflow; 数据科学 MLOps → Prefect / Metaflow
tensorflow.org) Introduction to TensorFlow — CPU vs GPU (medium.com/@erikhallstrm) TensorFlow: A primer (metaflow.fr
medium.com/@erikhallstrm) https://medium.com/@erikhallstrm/hello-world-tensorflow-649b15aed18c Tensorflow入门(metaflow.fr ) https://blog.metaflow.fr/tensorflow-a-primer-4b3fa0978be3 Tensorflow实现RNNs (wildml.com) http://www.wildml.com
erikhallstrm) https://medium.com/@erikhallstrm/hello-world-tensorflow-649b15aed18c TensorFlow: Aprimer (metaflow.fr ) https://blog.metaflow.fr/tensorflow-a-primer-4b3fa0978be3 RNNs inTensorflow (wildml.com) http://www.wildml.com