当前位置：文江博客话题详情

立法的 Diff 算法

发布于 2024-12-12 09:21:57 字数 279 浏览 8 评论 0原文

作为一个雄心勃勃的项目的一部分，我试图更好地理解美国国会提出的法案中写入的立法文本。我有最近账单的电子版本，并且正在尝试实现一种算法，将账单与之前的账单进行比较，寻找相似之处。假设许多失败的法案最终都会被纳入其他法案。

显然，这是一项艰巨的任务。关于不同引擎存在许多问题，但我的问题略有不同。很多时候提出的法案将多种想法整合在一起。因此，差异引擎需要比较账单的一部分，而不是整个账单。

关于差异算法或执行此操作的方法有什么建议吗？我可以使用强大的计算能力，但请记住，我将使用大约 100,000 张钞票的数据集。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

遮云壑 2024-12-19 09:21:57

看看 Simian - 相似度分析器。它适用于纯文本和代码。

回复收藏 0 原文

江城子 2024-12-19 09:21:57

非常有趣的想法。我将首先研究最长公共子序列算法，并了解如何将它们调整为 (1) 报告任何超过某个阈值的序列，例如 20 个单词，并且 (2) 看看是否可以让它们处理一点模糊性，以防一两个单词发生变化。我建议首先查看差异代码。

回复收藏 0 原文

~没有更多了~

关于作者

放赐

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

立法的 Diff 算法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

立法的 Diff 算法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。