根据sqoop.apache.org的说法,Sqoop 2功能不完整,不应该用于生产系统。公平地说,有些人可能想在他们的测试环境中测试Sqoop 2的新特性。
Cloudera在Sqoop 1和Sqoop 2 (sqoop2.html)之间有一个特性比较,但是根据页面,Sqoop 2没有提供任何Sqoop 1不提供的功能。
那么,为什么有人会使用Sqoop 2的当前形式呢?它比Sqoop 1有什么优势吗?若否,为何可供使用?提前感谢!
发布于 2017-11-10 13:56:02
发布于 2016-12-30 06:41:47
Apache使用客户端模型,用户需要安装Sqoop以及客户机上的连接器/驱动程序。Sqoop2使用基于服务的模型,其中连接器/驱动程序安装在Sqoop2服务器上。而且,所有的配置都需要在Sqoop2服务器上完成。
从MR的角度来看,另一个不同之处在于,Sqoop只提交一个Map作业,而Sqoop2则提交一个MapReduce作业,其中Mappers将从源传输数据,而还原程序将根据指定的源转换数据。这提供了一个干净的抽象。在Sqoop中,传输和转换都仅由Mappers提供。
从安全的角度来看,Sqoop2的另一个主要区别是。管理员将设置到源和目标的连接,而操作员用户使用已经建立的连接,因此操作员用户不需要知道有关连接的详细信息。如果需要,运营商将只能访问部分连接器。
https://stackoverflow.com/questions/41388979
复制相似问题