我正在尝试google cloud Vertex AI文本情感分析。我创建了一个基于以下引用的情感数据集:
https://cloud.google.com/vertex-ai/docs/datasets/prepare-text#sentiment-analysis
当我创建数据集时,我指定最大情感为1,以获得0-1的范围。该文档指出CSV文件应具有以下格式:
ml_use,gcs_file_uri|"inline_text",sentiment,sentimentMax
所以我创建了一个csv文件,如下所示:
我的电脑坏了。,0,1你太傻了。,1,1
正如文档中所指出的,我需要每个情感值至少10个条目。我为值0和1创建了11个条目,总共有22个条目。然后我上传了文件,得到了"Unable to import data but error",但错误消息是空白的。日志资源管理器中似乎没有记录错误。
我尝试导入一个文本分类模型,它正确地导入了。导入的行如下所示。
花很漂亮,高兴的草死了,悲伤的
我在情感数据方面做错了什么?
发布于 2021-10-12 19:27:22
好的,这个问题似乎与字符集有关。我已经使用Libre Office Calc生成了CSV文件,并将其导出为CSV。开箱即用,它似乎默认为西欧字符集,这在我的文本编辑器中看起来很好,但显然造成了问题,我将其更改为UTF-8,现在它正在导入我的数据集。
https://stackoverflow.com/questions/69540888
复制相似问题