使用sqoop将oracle数据导入hbase时,如何用隐藏列rownum作为--split-by?
如题,将oracle中的数据导入hbase,用rownum进行并行导入,最终只能导入一个map的数据,为什么?
/usr/hdp/2.3.2.0-2950/sqoop/bin/sqoop import --connect "jdbc:oracle:thin:@" --username --password \
--query "SELECT * FROM tablename where $CONDITIONS" \
--hbase-table testoracle --hbase-row-key SEQID --split-by ROWNUM -m 8 --column-family cf
表中共有800w+数据,如果用seqid作为分割,就能全部导入,如果用rownum分割就只能导入100w条。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论