我正在从teradata数据库中加载数据,如下所示:
df = spark.read.format("jdbc").option("url", "jdbc:teradata://url_of_teradata_db/MAYBENULL=ON,TYPE=FASTEXPORT,charset=ASCII").option("dbtable", "({}) as subq".format(req)).option("driver", "com.teradata.jdbc.TeraDriver").option("user", my_user).option("password", my_password).load()在我的数据中,我得到了一些不需要的角色,比如:\x00 & \x02 .
如何将这些字符正确地读入我的spark.read.format中?
我找到了NULLBYTEPREFIX,但我不知道如何使用它
编辑:
我的查询非常简单:
SELECT MY_ROW FROM MY_TABLE我询问teradata关于这个专栏的更多信息,我得到:
| Column Name | Type | Nullable | Format | Max length |
| My_TABLE.MY_ROW | CV | N | X(100) | 100 |发布于 2022-05-04 13:19:48
您能否检查数据库列的字符集并将这些字符集添加到上面的查询中。
如果您无法理解teradata中的字符集,您可以引用这个链接。
https://stackoverflow.com/questions/72111358
复制相似问题