C++实现文本文件查重算法的问题
新手
最近有一个题目,需要使用C++编写一个图形界面,实现两个>1k的文本文件(.txt)的查重,并将重复部分高亮显示。
现在已经实现了基本功能,使用QT,可以将A文件中的B文件中的句子高亮显示,但是有一个问题就是,B文件中只能是短语或者是单词,因为使用的是完全匹配算法,如果文章太长就不能找到。
现在想实现两篇文章输入,并显示出两篇文章的相同部分,请问使用什么算法?linux下的diff()函数类似。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
(目前对算法没有想法)
本着不重复发明轮子的信念我建议直接用diff,或者去看看diff的源码
这是百度到的资料链接
(如果有想法再补充,没有就弃坑了_(:3)JL)_