Ubuntu下打开的Excel文件,由R、OpenOffice读取

发布于 2024-10-10 23:27:17 字数 296 浏览 4 评论 0原文

我有一堆 Excel 文件,它们每天都会在 Windows 计算机上更新。我将它们转移到 Ubuntu 机器上并想在那里打开它们。具体来说,我想在R下将文件作为数据库读取。

几年前,我在Windows机器下使用ODBC通过R打开Excel文件。有什么办法,我可以在Ubuntu下使用R来做到这一点?

我可以使用 OpenOffice 为相应的 XLS 文件创建一个数据库 .ODB 文件,但我不知道如何连接到 .ODB 数据库。 OpenOffice似乎有办法连接TO数据库,但没有办法连接ODB。

感谢您提供任何可能的解决方案。

I have a bunch of Excel files which are updated on a daily basis on a Windows machine. I transfer them to a Ubuntu machine and want to open them there. Specifically, I want to read the files as a database under R.

A couple years ago, I used ODBC under a Windows machine to open Excel files through R. Is there any way, I can do this with R under Ubuntu?

I could make a database .ODB file for the corresponding XLS files using OpenOffice, but I don't know of a way to connect to a .ODB database. OpenOffice seems to have ways to connect TO databases, but no way to connect to ODB.

Thanks for any potential solutions.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

戏剧牡丹亭 2024-10-17 23:27:17

您也许可以使用 apt 中的 xls2csv -get install catdoc 将 Excel 文件转储为 CSV。然后你几乎可以从那里选择你的毒药以及它们是如何处理的。如果您想使用 SQL 语句提取信息,sqldf 包中的 read.csv.sql 可能会非常方便。

You might be able to get away with using xls2csv from apt-get install catdoc to dump the Excel files to CSV. Then you can pretty much pick your poison as to how they get proccessed from there. read.csv.sql from the sqldf package could be very handy if you want to extract information using SQL statements.

半衾梦 2024-10-17 23:27:17

我建议 xlsx 包,它没有特殊要求(例如xlsReadWrite等),因此可以在Linux下轻松使用。虽然它只能读取(和写入)xlsx 格式。

另一个问题可能是使用 中的 read.xls 函数gdata 包,它首先将 xls 文件转换为 csv,然后读取这些数据帧。您需要安装 Perl 和 xls2csv,这不是一个大问题在Linux下。

I would suggest xlsx package, which has no special requirements (like xlsReadWrite and others), so it can be easily used under Linux. Although it only reads (and writes) xlsx format.

Another aprouch could be using read.xls function in gdata package, which first convers xls files to csv, and read those dataframes. You will need Perl and xls2csv installed, which is not a big problem under Linux.

糖粟与秋泊 2024-10-17 23:27:17

您的 ODBC 解决方案应该可以在 Linux 上运行,前提是您安装了 uniXODBC 软件包(对于您的操作系统,如果编译 RODBC,您可能还需要 uniXODBC-devel 软件包code>) 和 R 的 RODBC 包。Gabor 在对 @daroczig 的回答的评论中提供的链接包含 Linux 上 RODBC 的一些详细信息;请注意,它在 Linux 上是只读的,并且设置起来可能很困难。

@daroczig 和 Gabor 建议的选项可能会更好,但如果您熟悉 ODBC,您可能也想在 Ubuntu 上尝试一下。

Your ODBC solution should work on Linux, providing you install the uniXODBC package (for your OS, you might also need the unixODBC-devel package if compiling RODBC) and the RODBC package for R. The link Gabor provides in his comment to @daroczig's answer has some details of RODBC on linux; note the points about this being read-only on Linux and the potentially difficult set-up.

You might well be better off with the options @daroczig and Gabor suggest, but if you are familiar with ODBC you might want to give it a try on Ubuntu also.

暗恋未遂 2024-10-17 23:27:17

还有另一种解决方案 - 将数据托管在两台计算机都可以访问的数据库中。如果你有足够的现金,Postgres 或 MySQL 不会花费你任何钱,或者 MS-SQL 服务器。您似乎正在尝试做的正是网络 RDBMS 的设计目的。您将能够在远程计算机上使用 Excel 和 R 中的数据。赢。

复制 Excel 文件是一个巨大的失败等待发生。给自己一个真正的 RDBMS。我会选择 Postgres。

There's another solution - host your data in a database to which both your machines have access. Postgres or MySQL will cost you nothing or MS-SQL server if you've got cash rattling around. What you seem to be trying to do is exactly what networked RDBMSs were designed for. You'll be able to play with the data in Excel and R on remote machines. Win.

Copying Excel files around is a massive fail waiting to happen. Get yourself a real RDBMS. I'd go for Postgres.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文