当前位置：文江博客话题详情

nlp information-retrieval machine-learning markov-chains

重建现在著名的 17 岁的基于马尔可夫链的信息检索算法“Apodora”

发布于 2024-11-28 06:19:25 字数 804 浏览 6 评论 0原文

当我们都在百思不得其解时，一名 17 岁的加拿大男孩显然发现了一种信息检索算法，该算法：

a）执行精度是当前广泛使用的向量空间模型的两倍

b）“相当准确”识别相似的单词。

c）使微搜索更加准确

这是一个很好的采访。

不幸的是，我还没有找到已发表的论文，但是，从我几年前参加的图形模型和机器学习课程中的片段来看，我认为我们应该能够从他提交的摘要以及他的内容中重建它在采访中谈到这一点。

来自采访：

某些搜索会查找出现在相似上下文中的单词。那是非常好，但这是遵循第一个关系程度。我的算法尝试进一步追踪连接。连接接近的被认为更有价值。理论上，如下连接到无限程度。

摘要将其放在上下文中：

引入了一种名为“Apodora”的新型信息检索算法，使用马尔可夫链状矩阵的极限幂来确定文档模型并进行上下文统计推断关于单词的语义。系统实现及对比到向量空间模型。特别是当查询很短时，新颖的算法给出的结果精度大约是两倍并且在微搜索方面有有趣的应用。

我觉得了解马尔可夫链式矩阵或信息检索的人会立即意识到他在做什么。

那么：他在做什么？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

楠木可依 2024-12-05 06:19:25

从使用“上下文”等词以及他引入了二阶统计依赖性的事实来看，我怀疑他正在做一些与论文中概述的 LDA-HMM 方法相关的事情：Griffiths, T., Steyvers, M。，布莱，D.，＆amp;特南鲍姆，J.（2005）。整合主题和语法。神经信息处理系统的进展。由于模型平均，搜索分辨率存在一些固有的限制。然而，我很羡慕 17 岁时就能做这样的事情，我希望他能独立完成一些事情，至少能做得更好。即使同一主题有不同的方向也会很酷。

回复收藏 0 原文

~没有更多了~

关于作者

凯凯我们等你回来

暂无简介

文章

评论

551 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

尘曦

文章 0 评论 0

在梵高的星空下

文章 0 评论 0

善良天后

文章 0 评论 0

韬韬不绝

文章 0 评论 0

qq_CgiN62

文章 0 评论 0

不美如何

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文