R 程序的首选数据源是什么?

发布于 2024-09-25 14:44:32 字数 448 浏览 2 评论 0 原文

此链接列出的数据集格式中的哪一种是最容易加载并在 R 中进行处理?使用文本编辑器几分钟应该足以将文本版本转换为文字数据,但其他形式之一是否可以在少于 O(n) 用户的时间内加载?

我找到了这个IO选项的详细列表< /a> 但它似乎不是特别有帮助。


PS我以前从未使用过R,并且试图帮助一位需要这样做的朋友

Which of the dataset formats listed at this link is the easiest to load for processing in R? A few minutes with a text editor should be enough to turn the text version into literal data but can one of the other forms be loaded in less than O(n) user effort?

I've found this laundry list of IO options but it dosn't seem especially helpful.


P.s. I've never used R before and am trying to help a friend who is the one that needs to do this.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

爱要勇敢去追 2024-10-02 14:44:32

获取文本文件并按照 电子表格中的说明进行操作R 数据导入/导出的数据部分。除非绝对必要,否则我会避免尝试读取 Excel 文件。

它可能很简单:

x <- read.table("file.txt", header=TRUE, sep="\t")
# or
x <- read.delim("file.txt") # header=TRUE and sep="\t" are already defaults

Grab the text files and follow the instructions in the spreadsheet-like data section of R Data Import/Export. I would avoid trying to read from Excel files unless you absolutely have to.

It could be as easy as:

x <- read.table("file.txt", header=TRUE, sep="\t")
# or
x <- read.delim("file.txt") # header=TRUE and sep="\t" are already defaults
下雨或天晴 2024-10-02 14:44:32

如果其他一切都失败了,为什么不阅读专门用于数据导入/导出的手册< /a>?

导入数据

  • 您可以从带有任意分隔符(csv、txt...)的 ascii 文件
  • 各种格式的固定格式文件
  • 二进制文件 (hdf5、netcdf、...)
  • 电子表格,大多数格式,甚至在非 Windows 平台
  • 数据库上 (DBIRODBC,...)
  • 网页(使用 XML 包)
  • Web 服务,例如 SOAP, JSON,...
  • 直接从使用连接的其他程序中,...
  • 更重要的

是,调用其中任何一个首选都是困难的 - 这完全取决于手头的任务。

If everything else fails, why not read the manual devoted to Data Import / Export ?

You can import data from

  • ascii files with whichever delimiter (csv, txt, ...)
  • fixed form files
  • binary files in various formats (hdf5, netcdf, ...)
  • spreadsheets, in most formats even on non-Windows platforms
  • databases (DBI, RODBC, ...)
  • web pages (using the XML package)
  • web services like SOAP, JSON, ...
  • directly from other programs using connections, ...
  • and more

so calling any one of these preferred is diffcult -- it all depends on the task at hand.

帅气称霸 2024-10-02 14:44:32

从可用的选项中,制表符分隔的文本文件是最容易导入的。接下来是 SPSS 文件,然后是其他所有内容。我同意其他海报,避免使用 .xls 文件(或将单页工作簿转换为 tsv、csv。foreign

包可用于打开这些 SPSS 文件,这同样简单:

install.packages("foreign")
library(foreign)

setwd("/Path/to/your/files")
read.spss("FILENAME.sav", to.data.frame=T)

From the options you have available, the tab delimited text files are the easiest to import. Followed by the SPSS files and then everything else. I agree with other posters, avoid files with .xls (or convert single sheet workbooks into tsv, csv.

The foreign package can be used to open those SPSS files which is just as easy:

install.packages("foreign")
library(foreign)

setwd("/Path/to/your/files")
read.spss("FILENAME.sav", to.data.frame=T)
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文