在 R 中，gunzip 文件流？

发布于 2024-09-07 09:30:34 字数 1170 浏览 6 评论 0原文

我正在尝试为 StackOverflow 创建 R API。输出经过 gzip 压缩。例如：

readLines("http://api.stackoverflow.com/0.9/stats/", warn=F)
[1] "\037‹\b"                                                                                                                                                                                                                                                                                         
[2] "\030\002úØÛy°óé½\036„iµXäË–[<üt—Zu[\\VmÎHî=ÜÛÝ¹×ýz’Í.äûû÷>ý´\a\177Ýh÷\017îÝÛÙwßÚáÿþ«¼þý\027ÅrÝæÔlgüÀëA±\017›ìŽï{M¤û.\020\037�Ë\"¿’\006³ì\032„Úß9¸ÿ`¼ç÷³*~ÿKêˆð¡\006v¦ð²ýô£�ñÃ�ì+ôU�_\026æ»½�]êt¼·?ÞûÈ4ù%\016~S0^>àe¶ÀG\037½n³éÛôKêç¼¬®‚\016Êê¢úý×u‰fó¶]=º{·aÎšŽ—y{·©î\026‹‹»h5^-/‚W1 |9[UÅ²õ^§�Ç"
[3] ":¬´¿1M\177ð\"0íö¹ñ…YÞLëbÕ*!~â\027\036§çU�®êê¢ÎˆµhòýæÅ´Zn\036S¶Z•ùv[§óm´î�"                                                                                                                                                                                                                      
[4] "Í™tËª^d¥£·üÂ?¾ÿ\033'¿$ù\177"

有没有一种好的方法可以在 R 中对此进行压缩，而不需要将输出写入文件，对其进行压缩，然后将其读回？

原文

I'm trying to create an R API for StackOverflow. The output is gzipped. For example:

readLines("http://api.stackoverflow.com/0.9/stats/", warn=F)
[1] "\037‹\b"                                                                                                                                                                                                                                                                                         
[2] "\030\002úØÛy°óé½\036„iµXäË–[<üt—Zu[\\VmÎHî=ÜÛÝ¹×ýz’Í.äûû÷>ý´\a\177Ýh÷\017îÝÛÙwßÚáÿþ«¼þý\027ÅrÝæÔlgüÀëA±\017›ìŽï{M¤û.\020\037�Ë\"¿’\006³ì\032„Úß9¸ÿ`¼ç÷³*~ÿKêˆð¡\006v¦ð²ýô£�ñÃ�ì+ôU�_\026æ»½�]êt¼·?ÞûÈ4ù%\016~S0^>àe¶ÀG\037½n³éÛôKêç¼¬®‚\016Êê¢úý×u‰fó¶]=º{·aÎšŽ—y{·©î\026‹‹»h5^-/‚W1 |9[UÅ²õ^§�Ç"
[3] ":¬´¿1M\177ð\"0íö¹ñ…YÞLëbÕ*!~â\027\036§çU�®êê¢ÎˆµhòýæÅ´Zn\036S¶Z•ùv[§óm´î�"                                                                                                                                                                                                                      
[4] "Í™tËª^d¥£·üÂ?¾ÿ\033'¿$ù\177"

Is there a good way to gunzip this in R, short of writing the output to file, gunzip'ing it, and reading it back in?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

放手` 2024-09-14 09:30:34

你可以这样做：

conn <- gzcon(url("http://api.stackoverflow.com/0.9/stats/"))
data <- readLines(conn)

You could do:

conn <- gzcon(url("http://api.stackoverflow.com/0.9/stats/"))
data <- readLines(conn)

回复收藏 0 原文

|煩躁 2024-09-14 09:30:34

尝试：

p <- gzcon(url("http://api.stackoverflow.com/0.9/stats/"))
readLines(p)

Try:

p <- gzcon(url("http://api.stackoverflow.com/0.9/stats/"))
readLines(p)

回复收藏 0 原文

只有一腔孤勇 2024-09-14 09:30:34

理想情况下，我们应该告诉服务器我们可以处理 gzip 压缩的内容，从 HTTP 标头中找出内容实际上是 gzip 编码的，然后仅在是时才解压缩。 Rcurl 库可以做到这一点：

library(Rcurl)
getURL("http://api.stackoverflow.com/0.9/stats/",
       .opts=list(encoding="identity,gzip")

Ideally we should tell the server that we can handle gzipped content, find out from the HTTP headers that the content is actually gzip encoded and then decompress only if it is. The Rcurl library can do this:

library(Rcurl)
getURL("http://api.stackoverflow.com/0.9/stats/",
       .opts=list(encoding="identity,gzip")

回复收藏 0 原文

~没有更多了~

关于作者

第七度阳光i

暂无简介

0 文章

0 评论

24 人气

关注发私信

游缘惊梦

文章 0 评论 0

关注

小兔几

文章 0 评论 0

关注

Glik

文章 0 评论 0

关注

生生漫

文章 0 评论 0

关注

Luxian

文章 0 评论 0

关注

Champion-Ming

文章 0 评论 0

友情链接

文江博客

在 R 中，gunzip 文件流？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

游缘惊梦

小兔几

Glik

生生漫

Luxian

Champion-Ming

友情链接

在 R 中，gunzip 文件流？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

游缘惊梦

小兔几

Glik

生生漫

Luxian

Champion-Ming

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。