在java中访问许多文本文件
我必须读取 20 个奇怪的相对较大的文件(在某些情况下主要是 txt 或 pdf),然后对它们执行一些文本处理。
我正在使用 BufferedReader 和循环来读取这些文件,有没有有效的方法来做到这一点?
我的问题:读取这些文件的内容并将它们分成标记,然后将它们存储在数据结构中。我现在使用数组,但我想使用有效的结构。
有人可以提出解决这两个问题的方法吗
I have to read 20 odd compartively big files (mostly txt or pdf in some cases) and then perform some text processing on them .
I am using a BufferedReader and a loop to read these files , is there an effective way to do this ?
My problem : Read the contents of these files and seperate them into tokens and then store them in a data structure . I am using an array now , but i would like to make use of an efficient structure .
Can somebody suggest a means to solve both these problems
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
由于您正在计算每个单词的频率,因此您应该使用一个列表,然后迭代该列表并使用一个以单词为键的映射来跟踪出现的次数
Since you are counting the frequency of each word you should use a list then iterate through the list and use a map with the key being the word to keep track of the number of occurences