当前位置：文江博客话题详情

读取带有不规则标题的文本文件（在 R 中）

发布于 2024-12-27 17:41:44 字数 328 浏览 1 评论 0原文

我正在尝试将一个平面文件读入 R。

它由 ';' 分隔并有 12 行注释来描述内容。我想阅读该文件并排除注释。

但问题是注释行 11 包含数据标头，如下所示：

# Fields: labno;姓名;多布；性别;地点; date

有没有一种方法可以从注释中提取标题并将其应用到数据中。我的想法是只读取前 11 行，并将 labno 中的所有内容存储为向量。我将从第 13 行读取所有内容，并使用存储向量作为日期的列名称。

有没有办法读取前 11 行并删除 labno 之前的所有内容，

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

半岛未凉 2025-01-03 17:41:44

步骤 1：（仅读取包含列名称的第十一行。）

hdrs <- read.table("somefile.txt", nrows=1, skip=10, comment.char="")

步骤 2：（读取文件的其余部分，允许默认自动名称）

dat <- read.table("somefile.txt", skip=12)

步骤 3：（在应用“字段”作为列名称之前删除无关字符）

names(dat)  <- scan(textConnection(sub("# Fields\\:", "", hdrs)), 
                      what="character", sep=";")

更高版本的 R 允许 ' scan' 以获得一个 'text' 参数，而不是需要尴尬的 textConnection 函数。

Step1: (read only the eleventh row containing column names. )

hdrs <- read.table("somefile.txt", nrows=1, skip=10, comment.char="")

Step2: (read the rest of the file, allowing default automatic names)

dat <- read.table("somefile.txt", skip=12)

Step3: (remove extraneous characters before applying the ‘fields’ as column names)

names(dat)  <- scan(textConnection(sub("# Fields\\:", "", hdrs)), 
                      what="character", sep=";")

Later versions of R allow ‘scan’ to have a ‘text’ argument rather than requiring the awkward textConnection function.

回复收藏 0 原文

~没有更多了~

关于作者

凹づ凸ル

暂无简介

文章

26 人气

关注发私信

櫻之舞

文章 0 评论 0

关注

弥枳

文章 0 评论 0

关注

m2429

文章 0 评论 0

关注

寻找一个思念的角度

文章 0 评论 0

关注

野却迷人

文章 0 评论 0

关注

我怀念的。

文章 0 评论 0

友情链接

文江博客

读取带有不规则标题的文本文件（在 R 中）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

读取带有不规则标题的文本文件（在 R 中）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。