我有一个集合col,包含
{
'_id': ObjectId(...)
'type': "a"
'f1': data1
}和我收藏的一样
{
'_id': ObjectId(...)
'f2': 222.234
'type': "b"
} 火花MongoDB连接器工作不太好。它在错误的字段中重新排序数据
例如:
{
'_id': ObjectId(...)
'type': "a"
'f1': data1
}
{
'_id': ObjectId(...)
'f1': data2
'type': "a"
}Rdd将是:
------------------------
| id | f1 | type |
------------------------
| .... | a | data1 |
| .... | data2 | a |
------------------------是否有使用多态模式的建议?
https://stackoverflow.com/questions/47789864
复制相似问题