在SQoop Import:Splitz大小
在SQOOP导入中,如果MySQL表的主要密钥ID的所有值从1到10000。一个离群值12000进来。您正在尝试使用该子句提及ID&lt< 20000。拆分尺寸是多少?
In sqoop import if the primary key id of mysql table has all values from 1 to 10000. An outlier 12000 came in. You are trying to import with a where clause mentioning id < 20000. What is the split size?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
拆分尺寸将计算为最小= 1,最大= 12000,因此max-min/no.of.mappers
在这里我们不会计算20000
Split size will be calculated as min=1 and max=12000 so max-min/no.of.mappers
Here we will not calculate 20000 because the actual highest value in primary key is 12000 12000/4=3000 mapper1 =1-3000 mapper2=3001-6000 mapper3=6001-9000 mapper 4=9001-12000