n-gram

n-gram

文章 0 浏览 2

使用 java hashmap 进行 n 元模型建模

我需要对 n 元语法(n 个单词的序列)及其上下文(出现在 n 元语法附近的单词及其频率)的集合进行建模。我的想法是这样的: public class Ngram { pr…

聽兲甴掵 2024-11-05 22:10:56 0 0

在 Python 中计算 n-gram 的逐点互信息 (PMI) 分数

我有一个很大的 n-gram 语料库和几个外部 n-gram。我想根据这个语料库(计数)计算每个外部 n-gram 的 PMI 分数。 有没有任何工具可以做到这一点,或…

别把无礼当个性 2024-10-20 23:30:55 0 0

安卓&模糊匹配、n-gram 和 Levenshtein 距离

我正在构建一个 Android 应用程序,它接受字符串输入并使用 Google API 返回书籍的排名列表。 我正在寻找一种方法来将用户输入的开放式字符串与列表中…

无戏配角 2024-10-19 09:28:27 2 0

如何找出文本块中最常用的 2 个单词组合?

如何从一段文本中找出我最常用的两个单词?换句话说,是否有一个在线或离线(或代码)工具,我可以在其中复制和粘贴文本,并输出我最常用的两个词频,…

古镇旧梦 2024-10-16 23:11:30 1 0

通过 shingles 和 termvector 组件自动完成

实现类似 Google 的自动完成功能的方法之一是将 shingles 和 Solr 1.4 中的 termvector 组件结合起来。 首先,我们使用 shingles 组件生成所有 n 元分…

笑忘罢 2024-10-16 18:14:34 3 0

使用马尔可夫模型将全大写转换为混合大小写及相关问题

我一直在考虑使用马尔可夫技术来恢复自然语言文本中丢失的信息。 将全部大写文本恢复为大小写混合。 将重音符号/变音符号恢复为应有但已转换为纯 ASCI…

好菇凉咱不稀罕他 2024-10-08 05:56:16 9 0

接近 MySQL 中的串行文本文件读取性能

我正在尝试在 python 中执行一些 n-gram 计数,我想我可以使用 MySQL(MySQLdb 模块)来组织我的文本数据。 我有一个相当大的表,大约有 1000 万条记…

伴梦长久 2024-10-06 16:56:14 3 0

使用余弦相似度测量的 n 元句子相似度

我一直在从事一个关于句子相似性的项目。我知道它已经被问过很多次了,但我只是想知道我的问题是否可以通过我正在做的方式使用的方法来完成,或者我应…

久夏青 2024-09-29 05:24:39 4 0

考虑 QWERTY 键盘布局检测随机键盘敲击

最近维基百科破坏行为检测竞赛的获胜者表示,可以通过“检测随机键盘”来改进检测考虑 QWERTY 的点击率 键盘布局”。 示例:woijf qoeoifwjf oiiwjf o…

风尘浪孓 2024-09-25 05:05:02 1 0

从句子生成 N 元语法

如何生成字符串的 n 元语法,例如: String Input="This is my car." 我想使用此输入生成 n 元语法: Input Ngram size = 3 输出应该是: This is my …

ヅ她的身影、若隐若现 2024-09-18 17:26:25 6 0

在 Perl 中从字符串中提取 n 元语法作为单词

除了 Text::Ngrams 之外,是否还有模块或 Perl 代码可以从字符串中提取 n 元词?…

橘寄 2024-09-16 22:00:22 4 0

Perl 段落 n 元语法

假设我有一个文本句子: $body = 'the quick brown fox jumps over the lazy dog' 我想将该句子放入“关键字”的哈希值中,但我想允许使用多单词关键…

桃酥萝莉 2024-09-15 08:21:40 6 0

SOLR 中的 EdgeNGramTokenizerFactory EdgeNGramFilterFactory 有什么区别?

这两种过滤器有什么区别? 它们的效果好像是一样的? 谁能提供一个例子来说明如何将它们应用于某些文本?…

三生殊途 2024-09-06 12:50:56 2 0

用于字符串相似度比较的 N 元语法分割函数

作为更好地理解我目前正在学习的 F# 的练习的一部分,我编写了函数 将给定字符串拆分为 n 元语法。 1)我想收到有关我的功能的反馈:可以以更简单或…

绮烟 2024-09-03 13:02:58 5 0

Drupal 的搜索模块可以搜索子字符串吗? (部分搜索)

Drupal的核心搜索模块,仅搜索关键字,例如“三明治”。我可以让它使用子字符串(例如“sandw”)进行搜索并返回我的三明治结果吗? 也许有一个插件可…

浅忆流年 2024-08-29 07:52:41 8 0
更多

推荐作者

1CH1MKgiKxn9p

文章 0 评论 0

ゞ记忆︶ㄣ

文章 0 评论 0

JackDx

文章 0 评论 0

信远

文章 0 评论 0

yaoduoduo1995

文章 0 评论 0

霞映澄塘

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文