当前位置：文江博客话题详情

在 C# 中读取制表符分隔的文本文件的最佳方法是什么

发布于 2024-08-19 03:32:58 字数 129 浏览 5 评论 0原文

我们有一个大约 100,000 行的文本文件，每行大约 50 列，大部分数据都非常小（5 到 10 个字符或数字）。

这是一个非常简单的任务，但只是想知道将此数据导入 C# 数据结构（例如 DataTable）的最佳方法是什么？

需要登录才能够评论，你可以免费注册一个本站的账号。

机场等船 2024-08-26 03:32:58

我会将其作为带有制表符列分隔符的 CSV 格式读取：

编辑：
以下是您需要的简单示例：

DataTable dt = new DataTable();
using (CsvReader csv = new CsvReader(new StreamReader(CSV_FULLNAME), false, '\t')) {
    dt.Load(csv);
}

其中 CSV_FULLNAME 是制表符分隔的 CSV 的完整路径 + 文件名。

I would read it in as a CSV with the tab column delimiters:

Edit:
Here's a barebones example of what you'd need:

DataTable dt = new DataTable();
using (CsvReader csv = new CsvReader(new StreamReader(CSV_FULLNAME), false, '\t')) {
    dt.Load(csv);
}

Where CSV_FULLNAME is the full path + filename of your tab delimited CSV.

星 2024-08-26 03:32:58

使用.NET 的内置文本解析器。它是免费的，具有出色的错误处理能力，并且可以处理很多奇怪的情况。

独孤求败 2024-08-26 03:32:58

FileHelpers 怎么样，您可以将制表符定义为分隔符。通过提供的链接前往该网站并查看一下。

希望这有帮助，
此致，
汤姆.

傾旎 2024-08-26 03:32:58

两个选项：

使用 System.Data.OleDb 命名空间中的类。这样做的优点是可以像您所要求的那样直接读取数据表，只需很少的代码，但要正确读取数据可能很困难，因为它是制表符而不是逗号分隔的。
使用或编写 csv 解析器。确保它是一个基于状态机的解析器，例如链接到的 @Jay Riggs，而不是基于 String.Split() 的解析器。这应该比 OleDb 方法更快，但它会给您一个列表或数组而不是数据表。