当前位置：文江博客话题详情

C malloc/free + 性能表现

发布于 2024-07-25 01:19:46 字数 918 浏览 11 评论 0原文

当我循环遍历文件 A 中的行时，我正在解析该行并将每个字符串 (char*) 放入 char** 中。

在一行的末尾，我运行一个程序，其中包括打开文件 B，使用 fgets、fseek 和 fgetc 来抓取其中的字符那个文件。然后我关闭文件 B。

我为每一行重复重新打开和重新关闭文件 B。

我想知道的是：

使用malloc和free是否会对性能产生重大影响，因此我应该使用myArray[之类的静态内容NUM_STRINGS][MAX_STRING_WIDTH] 而不是动态 char** myArray？
打开和关闭文件 B（概念上，数千次）是否会产生显着的性能开销？如果我的文件 A 已排序，是否可以使用 fseek 在文件 B 中“向后”移动，以重置我之前在文件 B 中的位置？

编辑事实证明，双重方法大大减少了运行时间：

我的文件 B 实际上是二十四个文件之一。我不是打开同一个文件 B1 一千次，然后打开 B2 一千次，等等。我打开文件 B1 一次，关闭它，打开 B2 一次，关闭它，等等。这减少了数千次 fopen 和 fclose 操作大约为 24。
我使用 rewind() 重置文件指针。

这使得速度提高了大约 60 倍，这已经足够了。感谢您向我指出 rewind()。

需要登录才能够评论，你可以免费注册一个本站的账号。

秋日私语 2024-08-01 01:19:46

如果动态数组随时间增长，某些 realloc 会产生复制成本。如果你使用“总是双倍”启发式，这会被摊销到 O(n)，所以这并不可怕。如果您提前知道大小，堆栈分配的数组仍然会更快。

对于第二个问题，请阅读有关倒带的内容。它必须比始终打开和关闭更快，并且可以让您减少资源管理。

暮光沉寂 2024-08-01 01:19:46

我想知道的是：

如果这两个答案都是“是”，则不要更改任何内容。

红颜悴 2024-08-01 01:19:46

打开和关闭的开销可变，具体取决于其他程序是否竞争该资源。

首先测量文件大小，然后使用它提前计算数组大小以进行一次大堆分配。

您不会立即获得多维数组，但只需进行一些指针算术即可。

您能否不在另一个文件中缓存位置信息，然后使用先前的查找索引作为偏移量，而不是打开和关闭它？确实取决于确切的逻辑。

等风也等你 2024-08-01 01:19:46

如果文件很大，磁盘 I/O 将比内存管理昂贵得多。在分析之前担心 malloc/free 性能表明它是一个瓶颈，这是不成熟的优化。
在您的程序中，频繁打开/关闭的开销可能很大，但实际的 I/O 可能会更昂贵，除非文件很小，在这种情况下，关闭和关闭之间的缓冲区会丢失open 可能会导致额外的磁盘 I/O。是的，您可以使用 ftell() 获取文件中的当前位置，然后使用 SEEK_SET fseek 来获取该位置。

使用动态内存总是会影响性能。使用静态缓冲区将提供速度提升。

重新打开文件也会对性能造成影响。您可以使用 fseek(pos, SEEK_SET) 将文件指针设置为文件中的任意位置，或使用 fseek(offset, SEEK_CUR) 进行相对移动。

显着的性能影响是相对的，您必须确定这对自己意味着什么。

梦境 2024-08-01 01:19:46

少女情怀诗 2024-08-01 01:19:46

在这两种情况下，都会对性能产生一些影响，但其重要性取决于文件的大小和程序运行的上下文。

如果您确实知道最大字符串数和最大字符串数，宽度，这会快很多（但是如果您使用的值小于“最大值”，您可能会浪费大量内存）。最好的办法是像 C++ 中的许多动态数组实现那样：每当您必须重新分配 myArray 时，分配所需空间的两倍，并且只有在空间用完后才再次重新分配。这具有 O(log n) 性能成本。
这可能会对性能造成很大影响。我强烈建议使用 fseek，尽管详细信息取决于您的算法。