我正在使用AutoML构建一个分类模型,我有一些关于GCP的基本用法问题。
1-数据隐私问题;如果我们保存行为数据以在BigQuery中训练我们的模型,谷歌是否有权访问这些数据?谷歌可以使用这些数据来了解更多我们收集的数据中个人的行为吗?
2-由于培训费用是按小时收费的,我想了解一下数据和培训时间之间的关系。时间是否随着训练数据集的大小而线性增加?例如,我们使用1.7MB的数据训练一个分类,花了3个小时。那么,训练一个拥有17MB数据的模型需要30个小时吗?
3-批量预测每小时1.16美元。然而,我们的数据是在csv中,似乎我们不能上传csv来进行批量预测。因此,我们将尝试使用API。因此,我有两个问题: A)我们可以使用API进行批量上传吗? B)相关的成本是什么?
4-在线预测到底是什么?
5-当使用成本计算器(用于机器学习)时,什么是节点小时?
发布于 2020-02-25 08:50:25
1-正如Data Usage FAQ中提到的那样,除了向您提供云AutoML服务外,谷歌不会将您的任何内容用于任何目的。
2-训练模型所需的时间取决于训练数据的大小和复杂性,有关详细解释,请查看Vision documentation示例。
3-您需要将csv文件上传到Google Cloud Storage,然后您可以在API或任何可用的客户端库中使用它。例如,请参见Natural Language batch prediction。对于成本,请查看所需产品的文档。AutoML定价取决于您使用的功能:Vision、Natural Language、Translation、Video Intelligence。
4-创建(训练)模型后,可以部署模型并请求在线(单一、低延迟和实时)预测。Online predictions接受一行数据,并根据该数据的模型提供预测结果。当您需要预测作为业务逻辑流的输入时,您可以使用在线预测。
5-您可以将节点视为单个虚拟机,其资源用于计算目的。机器类型因产品和用途的不同而不同。例如,在image classification中,AutoML视觉图像分类模型训练的成本为每节点小时3.15美元,每个节点相当于一台附加了NVIDIA Tesla V100的n1-standard-8机器。那么,节点小时就是该节点一个小时所使用的资源。
https://stackoverflow.com/questions/60289746
复制相似问题