在java中访问许多文本文件

发布于 2024-12-27 16:58:24 字数 210 浏览 1 评论 0原文

我必须读取 20 个奇怪的相对较大的文件(在某些情况下主要是 txt 或 pdf),然后对它们执行一些文本处理。

我正在使用 BufferedReader 和循环来读取这些文件,有没有有效的方法来做到这一点?

我的问题:读取这些文件的内容并将它们分成标记,然后将它们存储在数据结构中。我现在使用数组,但我想使用有效的结构。

有人可以提出解决这两个问题的方法吗

I have to read 20 odd compartively big files (mostly txt or pdf in some cases) and then perform some text processing on them .

I am using a BufferedReader and a loop to read these files , is there an effective way to do this ?

My problem : Read the contents of these files and seperate them into tokens and then store them in a data structure . I am using an array now , but i would like to make use of an efficient structure .

Can somebody suggest a means to solve both these problems

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

拥抱影子 2025-01-03 16:58:24

由于您正在计算每个单词的频率,因此您应该使用一个列表,然后迭代该列表并使用一个以单词为键的映射来跟踪出现的次数

Since you are counting the frequency of each word you should use a list then iterate through the list and use a map with the key being the word to keep track of the number of occurences

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文