当前位置：文江博客话题详情

nlp word2vec bert-language-model sentence-similarity doc2vec

句子变压器使用弓？

发布于 2025-01-31 10:10:43 字数 199 浏览 3 评论 0原文

我有一个与网页相关或以某种方式相关的术语（例如，来自HTML标签的关键字）。这些不是句子，它们只是关键字的集合，标题中的单词等。我感兴趣的是，在这样的网页上，我感兴趣的是找到最相似的内容。在一个有句子 /段落的情况下，我会想到使用句子变压器甚至doc2vec。但是在这种情况下，我只有一个页面的一组单词，没有真实的上下文或句子。我是否纠正这使我无法使用句子变压器 / doc2vec？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

随遇而安 2025-02-07 10:10:43

没有什么可以阻止您使用任何东西。相关测试是：用于您的唯一数据＆amp;目标？

doc2vec和其他浅水技术在不是完美的语法句子的列表上效果很好：他们通常使用单词的存在或不存在，而没有严格的语法理解，作为信号。对于许多目的而言，这足够了！

一些更深层次的变压器更依赖秩序的自然语言 - 但是我不确定直到尝试并显示出来。它可能起作用！只有数据（来自您的问题）的数据＆amp;目标可以比自己的实验更好。

尝试一些事情 - 包括超级简单的事物，例如在单词袋表示上的余弦相似之处，或基于某种程度的最重要术语的关键字搜索 - 然后根据您的需求/所需结果评估结果。

您可能会通过临时眼球开始一些评估 - “这看起来不错，这似乎是错误的” - 但理想情况下，记录了哪些文档“应该比其他人更相似，在您所需的最终系统中，以便最终您最终您可以对替代方法进行自动定量比较。

回复收藏 0 原文

~没有更多了~

关于作者

雄赳赳气昂昂

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

十二

文章 0 评论 0

飞烟轻若梦

文章 0 评论 0

OPleyuhuo

文章 0 评论 0

wxb0109

文章 0 评论 0

旧城空念

文章 0 评论 0

-小熊_

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文