Orchestrating TFX Pipelines Airflow
导语:
本文是 tensorflow 手册翻译系列的第二十一篇。
本文档详细介绍协调 TFX Pipelines。
Apache Airflow
Apache Airflow是一个以编程方式编写,计划和监视工作流的平台。 TFX使用Airflow将工作流编写为任务的有向无环图(DAG)。 Airflow计划程序在遵循指定的依存关系的同时在一组工作线程上执行任务。 丰富的命令行实用程序使在DAG上执行复杂的手术变得轻而易举。 丰富的用户界面使查看生产中正在运行的管道,监视进度以及在需要时对问题进行故障排除变得容易。 将工作流定义为代码时,它们将变得更具可维护性,可版本化,可测试和协作性。
有关安装和使用Apache Airflow的详细信息,请参见Apache Ai...
Click to read more ...
Custom TFX Component
导语:
本文是 tensorflow 手册翻译系列的第二十篇。
本文档详细介绍了如何高级自定义 TFX 组件的作用。
目录
自定义执行器或者自定义组件
如何创建自定义组件
组件规格
执行器
组件接口
组装到TFX管道中
部署自定义组件
正文
注意:本指南基于TFX 0.14.0,并且要求TFX> = 0.14.0。
自定义执行器或自定义组件
如果在组件的输入,输出和执行属性与现有组件相同的情况下仅需要自定义处理逻辑,则自定义执行程序就足够了。当任何输入,输出或执行属性与...
Click to read more ...
The Pusher TFX Pipeline Component
导语:
本文是 tensorflow 手册翻译系列的第十九篇。
本文档详细介绍了 Pusher 组件的作用。
目录
使用 Pusher 组件
正文
Pusher组件用于在模型训练或再训练期间将经过验证的模型推入部署目标。 它依赖于ModelValidator组件来确保新模型“足够好”以投入生产。
消耗:SavedModel格式的训练模型
发出结果:相同的SavedModel,以及版本控制元数据
使用推杆组件
Pusher管道组件通常非常易于部署,几乎不需要自定义,因为所有工作都是由Pusher TFX组件完成的。 典型的代码如下所示:
from tfx import components
...
pusher = components.Pushe...
Click to read more ...
The ModelValidator TFX Pipeline Component
导语:
本文是 tensorflow 手册翻译系列的第十八篇。
本文档详细介绍了 ModelValidator 组件的作用。
目录
使用模型验证组件
正文
ModelValidator TFX管道组件可帮助您验证导出的模型,以确保它们“足够好”可以投入生产。
ModelValidator将新模型与基线(例如当前服务的模型)进行比较,以确定它们相对于基线是否“足够好”。通过评估数据集上的两个模型(例如,保留数据或黄金数据集)并计算其在指标上的表现(例如,AUC,损失)来做到这一点。如果新模型的指标相对于基线模型满足用户指定的标准(例如,AUC不低于),则模型“有福”(标记为“好”),从而向Pusher表示可以将模型推向生产环境。
消耗:来自SchemaG...
Click to read more ...
The Evaluator TFX Pipeline Component
导语:
本文是 tensorflow 手册翻译系列的第十七篇。
本文档详细介绍了 Evaluator 组件的作用。
目录
评估器和 TensorFlow 模型分析
使用评估器组件
正文
Evaluator TFX管道组件对模型的训练结果进行深入分析,以帮助您了解模型如何对数据子集执行。
消耗:来自Trainer的EvalSavedModel
发射:对ML元数据的分析结果
评估器和TensorFlow模型分析
评估程序利用TensorFlow模型分析库执行分析,然后使用Apache Beam进行可伸缩处理。
使用评估器组件
评估程序管道组件通常非常易于部署,几乎不需要自定义,因为所有工作都是由评估程序TFX组件完成的。 典型的代码如下所示:
fro...
Click to read more ...
The Trainer TFX Pipeline Component
导语:
本文是 tensorflow 手册翻译系列的第十六篇。
本文档详细介绍了 Trainer 组件的作用。
目录
训练器和 TensorFlow
配置一个训练器组件
正文
Trainer TFX管道组件训练TensorFlow模型。
培训师需要:
tf。用于培训和评估的示例。
用户提供的模块文件,用于定义训练器逻辑。
由SchemaGen管道组件创建的数据模式,开发人员可以选择更改数据模式。
训练参数和评估参数的原型定义。
由上游Transform组件生成的可选变换图。
用于诸如热启动之类的方案的可选基本模型。
Trainer发出:一个SavedModel和一个EvalSavedModel
培训师和TensorFlow
Trainer广泛使...
Click to read more ...
TensorFlow Transform
导语:
本文是 tensorflow 手册翻译系列的第十五篇。
本文档详细介绍了 Transform 组件的作用。
目录
安装
依赖库
兼容版本
问题
正文
TensorFlow Transform是一个用于使用TensorFlow预处理数据的库。 tf.Transform对于需要完全通过的数据很有用,例如:
通过平均值和标准偏差对输入值进行归一化。
通过在所有输入值上生成词汇表,将字符串转换为整数。
通过根据观察到的数据分布将浮点数分配给存储桶,将浮点数转换为整数。
TensorFlow内置了对单个示例或一批示例进行操作的支持。 tf.Transform扩展了这些功能,以支持对示例数据的全过程。
t...
Click to read more ...