如何在自定义地图和自定义地图的帮助下实现连接Hive 中的自定义缩减脚本
我是 Hive 的新手,我正在尝试在 Hive 中执行任务。 我知道我们可以在 hive 中创建映射脚本和化简脚本,但我对映射脚本和化简脚本中包含哪些内容感到困惑?
谁能告诉我地图和地图中应包含哪些内容?减少脚本以便我可以尝试使用它来实现连接条件? 有什么材料可以让我想到吗?
谢谢
I am newbie to hive and I am trying to implement a task in Hive.
I come to know that we can create map scripts and reduce scripts in hive, but I am confused about that what to include in map-scripts and reduce scripts?
Can anyone tell me what to include in map & reduce scripts so that I can try for implementing the join condition using it?
Is there any material so that I can idea?
Thanks
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
Hive 在后端生成 Map/Reduce 任务。要查询 hive 中的数据,请进入 Hive CLI ($HIVE_HOME/bin/hive) 并执行 Hive-SQL (HQL) 命令。您可以在 HQL 中进行联接。
在开发针对配置单元中存储的数据运行的查询时,我使用的最佳参考是 http://wiki。 apache.org/hadoop/Hive/LanguageManual。
Hive generates map/reduce tasks in the back end. To query the data in hive you go into the Hive CLI ($HIVE_HOME/bin/hive) and execute Hive-SQL (HQL) commands. You can do joins in HQL.
The best reference I use when developing queries to run against my data stored in hive is http://wiki.apache.org/hadoop/Hive/LanguageManual.