当前位置：文江博客话题详情

解析非常繁忙的空格分隔文件

发布于 2024-12-23 02:10:42 字数 293 浏览 1 评论 0原文

我正在努力帮助我的父亲——他给了我一份他工作中的日程安排应用程序的导出信息。我们正在尝试是否可以将其导入 mysql 数据库，以便他/同事可以与其在线协作。

我尝试了许多不同的方法，但似乎没有一个能正常工作——而且这不是我的专业领域。

导出可以在此处查看：http://roikingon.com/export.txt

有关如何导出的任何帮助/建议去解析这个将不胜感激！

谢谢！！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

迷迭香的记忆 2024-12-30 02:10:42

我尝试编写一个（有点动态的）固定列解析器。看一下：http://codepad.org/oAiKD0e7（对于SO来说太长了，但大部分只是“数据”）。

我注意到

文本数据与右侧的填充左对齐，例如 "hello___" (_ = space)
数字数据与左侧的填充右对齐 < code>"___42"

如果你想使用我的代码，还有一些事情要做：

记录类型 12.x 具有可变列数（在一些静态列之后），你必须实现另一个“处理程序”它
是我的一些宽度很可能是错误的。我认为有一个系统（比如数字是 4 个字符长，文本是 8 个字符长，特殊情况有一些变化）。具有领域知识和多个示例文件的人可以找出这些列。
获取原始数据只是第一步，您必须将原始数据映射到一些有用的模型并将该模型写入数据库。

回复收藏 0 原文

私藏温柔 2024-12-30 02:10:42

使用该文件结构，您基本上需要对专有格式进行逆向工程。是的，它是空格分隔的，但格式不遵循任何类型的标准，如 CSV、YAML 等。它完全是专有的，似乎是一个标头和带有自己标头的单独部分。

我认为你最好的选择是尝试看看是否有其他类型的导出可以完成，例如 Excel 或 XML，并从那里开始工作。如果没有，则查看是否有某种可以在屏幕上抓取的 html 输出，然后粘贴到 Excel 中，看看会得到什么。

由于我上面提到的一切，将当前形式的文件调整为可以明智地导入数据库的内容将非常困难。（请注意，从文件结构来看，将需要许多表。）

回复收藏 0 原文

迷迭香的记忆 2024-12-30 02:10:42

您可以将 split 与正则表达式一起使用（零个或多个空格）。

我会尽力让你知道。

您的数据似乎没有结构。

$data = "12.1  0    1144713      751  17  Y   8  517  526  537  542  550  556  561  567                                     17 ";

$arr = preg_split("/ +/", $data);
print_r($arr);

Array
(
    [0] => 12.1
    [1] => 0
    [2] => 1144713
    [3] => 751
    [4] => 17
    [5] => Y
    [6] => 8
    [7] => 517
    [8] => 526
    [9] => 537
    [10] => 542
    [11] => 550
    [12] => 556
    [13] => 561
    [14] => 567
    [15] => 17
    [16] =>
)

试试这个 preg_split("/ +/", $data); ，它将行分割成零个或多个空格，然后你将得到一个可以处理的漂亮数组。但是查看您的数据，没有结构，因此您必须知道哪个数组元素对应于什么数据。

祝你好运。

you can use split with a regular expression (zero or more spaces).

I will try and let you know.

There doesnt seem to be a structure with you data.

$data = "12.1  0    1144713      751  17  Y   8  517  526  537  542  550  556  561  567                                     17 ";

$arr = preg_split("/ +/", $data);
print_r($arr);

Array
(
    [0] => 12.1
    [1] => 0
    [2] => 1144713
    [3] => 751
    [4] => 17
    [5] => Y
    [6] => 8
    [7] => 517
    [8] => 526
    [9] => 537
    [10] => 542
    [11] => 550
    [12] => 556
    [13] => 561
    [14] => 567
    [15] => 17
    [16] =>
)

Try this preg_split("/ +/", $data); which splits the line by zero or more spaces, then you will have a nice array, that you can process. But looking at your data, there is no structure, so you will have to know which array element corresponds to what data.

Good luck.

回复收藏 0 原文