当前位置：文江博客话题详情

R 可以处理多少数据？

发布于 2024-10-28 18:52:27 字数 1539 浏览 6 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

腹黑女流氓 2024-11-04 18:52:28

R 已成为参加 Kaggle.com 数据建模竞赛的开发人员的首选平台，这一事实也许很好地表明了 R 适合“大数据”。请参阅 Revolution Analytics 网站上的文章 - - R 以可观的优势击败了 SAS 和 SPSS。 R 缺乏开箱即用的数字处理能力，但它的灵活性显然弥补了这一点。

除了网络上提供的内容之外，还有几本新书介绍如何到处理大数据的热棒 R。 R 编程艺术（Matloff 2011；No Starch Press）介绍了编写优化的 R 代码、并行计算，并将 R 与 C 结合使用。整本书写得很好，有很棒的代码示例和演练。 Parallel R（McCallum & Weston 2011；O'Reilly）看起来也不错。

回复收藏 0 原文

白云悠悠 2024-11-04 18:52:28

我将用 R 和大数据集解释我的短篇故事。
我有一个从 R 到 RDBMS 的连接器，

我在其中存储了 8000 万个化合物。

我已经构建了一个收集此数据的一些子集的查询。
然后操纵这个子集。
我的 PC 内存中超过 200k 行，R 简直让人窒息。

core duo
4 GB ram

因此，为机器开发一些适当的子集是一个很好的方法。

回复收藏 0 原文

葬花如无物 2024-11-04 18:52:27

如果您查看 CRAN 上的高性能计算任务视图，您会得到一个好主意R 在高性能意义上可以做什么。

回复收藏 0 原文

转角预定愛 2024-11-04 18:52:27

原则上，您可以存储与 RAM 一样多的数据，但例外目前，向量和矩阵仅限于 2^31 - 1 个元素，因为 R 在向量上使用 32 位索引。一般向量（列表及其派生数据帧）仅限于 2^31 - 1 个分量，并且每个分量都具有与向量/矩阵/列表/data.frames 等相同的限制。

当然，这些是理论限制，如果你想对 R 中的数据做任何事情，它不可避免地需要空间来保存至少几个副本，因为 R 通常会将传递到函数等的数据复制。

有人努力允许磁盘存储（而不是在 RAM 中）；但即使是那些在 R 中使用时也会受到上面提到的 2^31-1 限制。请参阅@Roman 帖子中链接的高性能计算任务视图的大内存和内存不足数据部分。

回复收藏 0 原文

~没有更多了~

关于作者

时光磨忆

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

R 可以处理多少数据？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

燃烧我的卡路李先生

qq_2gSKZM

∞梦里开花

qq_IklFPL

迷途知返

深海不蓝

友情链接

R 可以处理多少数据？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

燃烧我的卡路李先生

qq_2gSKZM

∞梦里开花

qq_IklFPL

迷途知返

深海不蓝

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。