使用R解压gz文件
我过去曾使用 ?unzip
使用 R 来获取压缩文件的内容。这一次,我很难从 .gz 文件中提取文件,该文件可以在 此处。
我已经尝试过 ?gzfile
和 ?gzcon
但无法让它工作。我们将非常感谢您提供的任何帮助。
I have used ?unzip
in the past to get at contents of a zipped file using R. This time around, I am having a hard time extracting the files from a .gz file which can be found here.
I have tried ?gzfile
and ?gzcon
but have not been able to get it to work. Any help you can provide will be greatly appreciated.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(6)
这是一个有效的示例,可以帮助说明
gzfile()
和gzcon()
的作用现在文件已写入,而不是隐式使用
file( )
,使用gzfile()
:你指向的文件是一个压缩的tar存档,据我所知,R本身没有tar存档的接口。它们通常用于分发源代码——例如 R 包和 R 源代码。
Here is a worked example that may help illustrate what
gzfile()
andgzcon()
are forNow that the file is written, instead of implicit use of
file()
, usegzfile()
:The file you point is a compressed tar archive, and as far as I know, R itself has no interface to tar archives. These are commonly used to distribute source code--as for example for R packages and R sources.
要在 R 中取消压缩文件,您可以执行
或
但随后您会得到默认 (remove=TRUE) 行为,其中在完全创建并关闭输出文件后删除输入文件。
To un-gz a file in R you can do
or
But then you get the default (remove=TRUE) behavior in which the input file is removed after that the output file is fully created and closed.
如果您确实想解压缩文件,只需使用支持 gzip 的
untar
函数即可。例如:
If you really want to uncompress the file, just use the
untar
function which does support gzip.E.g.:
http:// /blog.revolutionanalytics.com/2009/12/r-tip-save-time-and-space-by-compressing-data-files.html
R为某些类型的压缩添加了透明解压缩最新版本(2.10)中的文件。如果您使用 bzip2、xvz 或 gzip 压缩文件,则可以将它们读入 R,就像它们是纯文本文件一样。您应该具有正确的文件扩展名。
命令...
#gzip 压缩文件具有“gz”扩展名
将像“myFile.gz”是原始文本文件一样工作。
http://blog.revolutionanalytics.com/2009/12/r-tip-save-time-and-space-by-compressing-data-files.html
R added transparent decompression for certain kinds of compressed files in the latest version (2.10). If you have your files compressed with bzip2, xvz, or gzip they can be read into R as if they are plain text files. You should have the proper filename extensions.
The command...
#gzip compressed files have a "gz" extension
Will work just as if 'myFile.gz' were the raw text file.
如果是逗号/制表符分隔的文件,则可以使用data.table的
fread()
。它可以处理压缩(.zip、.gz)文件:If it's a comma/tab-separated file, you can use data.table's
fread()
. It can handle zipped (.zip, .gz) files:与 tsv.gz 配合使用效果良好
works fine with
tsv.gz