理想的算法方法——规则引擎/决策树和一些学习逻辑？

发布于 2024-11-09 09:17:33 字数 653 浏览 8 评论 0原文

我的要求可能接近人们对“专家系统”的期望。并寻找最简单的解决方案，可以为我提供实时或近乎实时的推理，并具有一些离线（非实时）学习功能。

详细地说，我的问题是——

观看实时更新的日志，并将每个条目分类为红色、绿色和蓝色。红、绿、蓝的分类是基于编码为生产规则的逻辑（正如我今天所想象的那样）。

具有挑战性的一点是 -

1）标记为蓝色的日志条目最终必须根据后续日志条目标记为红色/绿色，我们希望在其中获得更详细的信息，因此需要记住一点。确切的等待时间无法提前得知，但有一个最大限制。当然，在任何给定时间点，可能有数十万个标记为蓝色的条目。

2) 判定红&的规则绿色并不完美，因此有时标签会出现错误。因此，偶尔的人工审核会发现这些错误。我的主要挑战是看看我是否可以用最少的编程工作来自动化规则更新的某些部分。

我的（持续研究）表明基于 RETE 算法的规则引擎可能会为我的分类和分类服务。标签，包括重新标签。如果可行，我仍然需要弄清楚如何自动化“从错误中学习”的部分？可以采用一种统计方法——贝叶斯分类吗？另外，对于我已经充分手动训练系统的初始分类，可以将贝叶斯分类完全与规则引擎相比较吗？贝叶斯方法似乎通过“信任统计数据”方法“简化”了维护一组正确规则的任务，尤其是在存在这些定期手动审核的情况下。

PS>我的主要应用程序是用 C++ 编写的（如果这很重要的话）。

原文