批处理 php 的 fgetcsv

发布于 2024-10-10 11:06:03 字数 261 浏览 6 评论 0原文

我有一个相当大的 csv 文件（至少对于网络而言），我无法控制。它有大约 100k 行，并且只会变得更大。

我使用 Drupal Module Feeds 基于此数据创建节点，并且它们的解析器以 50 行为一组进行批处理解析。然而，他们的解析器无法正确处理引号，并且无法解析大约 60% 的 csv 文件。 fgetcsv 可以工作，但据我所知不能批量处理。

当尝试使用 fgetcsv 读取整个文件时，PHP 最终耗尽了内存。因此，我希望能够将事物分解成更小的块。这可能吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

可爱暴击 2024-10-17 11:06:03

fgetcsv() 的工作原理是从给定的文件指针一次读取一行。如果 PHP 内存不足，也许您正在尝试立即解析整个文件，将其全部放入一个巨大的数组中。解决方案是逐行处理它，而不将其存储在大数组中。

要更直接地回答批处理问题，请从文件中读取 n 行，然后使用 ftell() 查找文件中结束的位置。记下这一点，然后您可以在将来的某个时刻通过在 fgetcsv() 之前调用 fseek() 返回到这一点。

回复收藏 0 原文

怪我入戏太深 2024-10-17 11:06:03

好吧，创建一个函数来解析一堆行：

function parseLines(array $lines) {
    foreach ($lines as $line) {
        //insert line into new node
    }
}

然后，只需将其批处理：

$numberOfLinesToBatch = 50;
$f = fopen($file, 'r');
if (!$f) die('implement better error checking');

$buffer = array();
while ($row = fgetcsv($f)) {
    $buffer[] = $row;
    if (count($buffer) >= $numberOfLinesToBatch) {
        parseLines($buffer);
        $buffer = array();
    }
}
if (!empty($buffer)) {
    parseLines(buffer);
}

fclose($f);

它将数据流入，您可以通过调整变量来调整它缓冲的行数......

Well, create a function to parse a bunch of lines:

function parseLines(array $lines) {
    foreach ($lines as $line) {
        //insert line into new node
    }
}

Then, just batch it up:

$numberOfLinesToBatch = 50;
$f = fopen($file, 'r');
if (!$f) die('implement better error checking');

$buffer = array();
while ($row = fgetcsv($f)) {
    $buffer[] = $row;
    if (count($buffer) >= $numberOfLinesToBatch) {
        parseLines($buffer);
        $buffer = array();
    }
}
if (!empty($buffer)) {
    parseLines(buffer);
}

fclose($f);

It streams the data in, and you can tune how many rows it buffers by tweaking the varariable...

回复收藏 0 原文