当前位置：文江博客话题详情

将 CSV 文件拆分为精确的 1GB 文件或更少？

发布于 2024-10-20 14:41:44 字数 1536 浏览 2 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

沩ん囻菔务 2024-10-27 14:41:44

如何将源中的前 1 GB 数据复制到新文件中，然后向后搜索最后一个换行符，然后截断新文件。然后您就知道第一个文件有多大，然后对第二个新文件重复该过程，从该点到稍后的 1 GB。对我来说，几乎任何语言都很简单（你提到了 C#，我最近没有使用过它，但它当然可以轻松完成这项工作）。

您没有明确说明是否需要将标题行（如果有）复制到每个结果文件中。同样，应该很简单——只需在将数据复制到每个文件之前执行此操作即可。

您还可以采用以下方法：在 Unix 上使用 tar 或在 Windows 上使用一些类似 Zip 的实用程序来一般性地拆分文件，然后告诉您的大文件挑战伙伴从该格式重建文件。或者，也许简单地压缩 CSV 文件就可以了，并让您在实践中低于限制。

回复收藏 0 原文

爱*していゐ 2024-10-27 14:41:44

您只需要注意几件事：

保留换行符：将文件拆分为新行（从算法上讲，将上一行的文件拆分为发生 1GB 限制的位置减去标题行大小
） header 到新文件的开头，然后粘贴其余部分
保留编码。

回复收藏 0 原文

缺⑴份安定 2024-10-27 14:41:44

在 bash/终端提示符中，写入：

man split

.. then

man wc

.. 只需计算文件中的行数，将其除以 X，输入要分割的数字，您就有 X 个小于 1.1GB 的文件（如果 x = 文件大小/1.1 ）

In a bash/terminal prompt, write:

man split

.. then

man wc

.. simply count the number of lines in the file, divide it by X, feed the number to split and you have X files less than 1.1GB (if x = filesize/1.1)

回复收藏 0 原文

~没有更多了~

关于作者

岛徒

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

将 CSV 文件拆分为精确的 1GB 文件或更少？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

烙印

singlesman

给自己一个微笑

独孤求败

晨钟暮鼓

我是自愿种绣球花的

友情链接

将 CSV 文件拆分为精确的 1GB 文件或更少？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

烙印

singlesman

给自己一个微笑

独孤求败

晨钟暮鼓

我是自愿种绣球花的

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。