我可以从 google Fine 调用外部 *python* 函数吗?
我正在研究 Google 优化以加快我的一些数据工作 - 本周之前从未使用过它,但我喜欢我所看到的很多内容。
到目前为止我最大的问题是是否可以从 Refine 调用外部 python 函数。我知道您可以在内部调用 jython,但这不提供对基于 C 的 python 库(例如 lxml)的访问,并且我在其他地方有想要集成的脚本,而无需大量复制粘贴或重写麻烦。
在 Refine 中有哪些选项可以实现此目的?我愿意发挥创意——我只想要一个稳定的、可重复使用的解决方案。
I'm investigating Google refine to speed up some of my data work -- never used it before this week, but I like a lot of what I see.
My biggest question so far is whether it's possible to call external python functions from Refine. I know you can call jython internally, but that doesn't provide access to C-based python libraries (e.g. lxml), and I have scripts elsewhere that I'd like to integrate, without lots of copy-paste or rewrite hassle.
What options are there for doing this in Refine? I'm willing to get creative -- I just want a stable, re-usable solution.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
正如 Google Refine Wiki 所说:
但是您可以尝试 Google Refine Python 客户端库,用于创建项目并以编程方式操作数据。
As Google Refine Wiki says:
But you can try Google Refine Python Client Library to create projects and manipulate your data programmatically.
我将把 reclosedev 的答案标记为已接受,但这个故事还有更多内容。
这个问题的另一个答案是您可以设置自己的基于 python 的 API。对于这个项目,我能够设置一个在本地服务器上运行的 django 应用程序。只花了一个小时左右就为我现有的库构建了 API。
比我想要的更麻烦,但它符合这个项目的要求,而且不会占用太多时间。
I'm going to mark reclosedev's answer as accepted, but there's still a litle more to the story.
The other answer to this question is that you can set up your own python-based API. For this project, I was able to set up a django app running on a local server. It only took an hour or so to build the API to my existing library.
More hassle than I'd have liked, but it fit the bill for this project without soaking up too much time.