我对Hive现在有UPDATE语句感到有点惊讶(尽管它看起来像是从v0.14回来的),尽管我很清楚一段时间以来,Hive的路线图是拥有完整的或接近RDBMS-SQL的功能。
您能总结一下Hive的插入、更新、删除与关系数据库的不同之处吗?它的限制是什么(在撰写本文时,Hive的版本是2.1.0)?
如果Hive继续改进其类似RDBMS的SQL功能,比如2-3年后,它会对关系数据库工作负载有用吗?
(不过,我不知道完整的路线图。如果这是一个愚蠢的问题,或者是由于懒于浏览文档而导致的问题,请原谅。)
发布于 2016-09-30 01:25:12
支持配置单元的插入。然而,对于update和delete操作,以下是仅适用于ORC格式的要求,对于存储桶的表必须指定TBLPROPERTIES ("transactional"="true")
延迟仍然是此操作的一个问题,以下是为什么引入酸兼容性的使用案例。然而,在路线图中,hive并不打算取代事务关系数据库。
https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions#HiveTransactions-Limitations
https://stackoverflow.com/questions/39672958
复制相似问题