当前位置：文江博客话题详情

Python parsing plagiarism-detection

解析器生成

发布于 2024-09-28 10:12:44 字数 227 浏览 6 评论 0原文

我正在做一个关于软件剽窃检测的项目..我打算用C语言来完成它..为此我应该创建一个令牌生成器和一个解析器..但我不知道在哪里首先..任何人都可以帮助我解决这个问题..

我创建了一个令牌数据库，并将令牌与我的程序分开。我想做的下一件事是比较两个程序以查明它是否抄袭。为此，我需要创建一个语法分析器。我不知道从哪里开始...

即我想为 python 中的 c 程序创建一个解析器

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

末蓝 2024-10-05 10:12:44

如果您想在 Python 中创建解析器，您可以查看这些库：
PLY
pyparsing
和 Lepl - 新但非常强大

回复收藏 0 原文

风铃鹿 2024-10-05 10:12:44

自己构建一个真正的 C 解析器是一项非常艰巨的任务。

我建议你要么找到一个已经完成的，例如。 pycparser 或者您定义一个非常简单的易于解析的 C 子集。

解析完 C 后，您的抄袭检测器将有大量工作要做。

回复收藏 0 原文

猫性小仙女 2024-10-05 10:12:44

我不确定您是否需要解析令牌流来检测您正在寻找的功能。事实上，这可能会让事情变得更加复杂。

您真正要寻找的是与正在测试的可疑示例代码具有非常强的相似性的原始源代码序列。这听起来与贝叶斯分类器的用途非常相似，就像垃圾邮件过滤和语言检测中使用的分类器一样。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

雪花的坚持

文章 0 评论 0

温柔一刀

文章 0 评论 0

扛起拖把扫天下

文章 0 评论 0

北方的韩爷

文章 0 评论 0

绝對不後悔。

文章 0 评论 0

青衫负雪

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文