在 R 和 Hive (Hadoop) 数据库之间建立连接
有谁知道如何实现这一目标?
我假设 RJDBC 会有所帮助;但根据我(可能很天真的)的理解,为此编写或调整 Hive 驱动程序需要进行一些调整。
相关文档:
- http://wiki.apache.org/hadoop/Hive/HiveClient
- < a href="http://cran.r-project.org/web/packages/RJDBC/RJDBC.pdf" rel="noreferrer">http://cran.r-project.org/web/packages/RJDBC/ RJDBC.pdf
欢迎任何帮助或建议!如果以前没有人这样做过,我很乐意为解决方案编写一些代码,但我几乎不知道 Java。
Does anyone know how to achieve that?
I am assuming that RJDBC would help; but from my (likely naive) understanding, a bit of tweaking is necessary to write or adapt a Hive driver for this.
Relevant documentation:
Any help or suggestion is welcome! If no one did this before, I would be happy to code a bit towards a solution but I know next to no Java.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
R 可以通过 RJDBC 与 Hive 连接。但是,您需要 Hive 服务器和驱动程序。
Hive 服务器:
驱动程序:下载 Toad for Cloud DB,http://www.toadworld.com/ m/freeware/566.aspx,并使用其中包含的驱动程序(解压缩 jar 并查找下面的文件)。
下面是一个 R 函数,您可以定义它来创建与 Hive 服务器的连接。
R can be interfaced with Hive via RJDBC. However, you'll need a Hive server and drivers.
Hive server:
Drivers: download Toad for Cloud DBs, http://www.toadworld.com/m/freeware/566.aspx, and use drivers included there (unzip the jars and look for the files below).
Below is an R function that you can define to create a connection to a Hive server.
我还没有测试过这些,但尝试 RHIPE 和 hive 包。
请参阅此 quora 问题(特别是 Jeff Hammerbacher 的回答) )以讨论其他选项。
I haven't tested these, but try the RHIPE and hive packages.
See this quora question (particularly Jeff Hammerbacher's answer) for a discussion of other options.