nltk

nltk

文章 17 浏览 55

使用自然语言处理来解析网站

我通常对通过爬行网站进行数据挖掘感兴趣,但我从未找到很多关于我真正想要实现的过程的文档。我非常热衷于编写一组基本规则来定义如何解析页面,然后…

黑寡妇 2024-12-12 12:10:08 0 0

使用 NLTK 提取关系

这是我的问题的后续。我正在使用 nltk 来解析人、组织及其关系。使用这个示例,我能够创建人员和组织的块;但是,我在 nltk.sem.extract_rel 命令中遇…

风吹过旳痕迹 2024-12-11 08:55:19 0 0

面向网络/浏览器的开源机器学习项目?

在浏览器环境(主要是 Javascript)中或作为 Web 应用程序应用机器学习技术,更具体地说是文本挖掘技术,并不是一个被广泛讨论的话题。 我想构建自己…

月亮邮递员 2024-12-09 23:15:50 2 0

NLTK/NLP 构建多对多/多标签主题分类器

我有一个包含超过 5000 个 XML 主题索引文档的人工标记语料库。它们的大小从几百千字节到几百兆字节不等。是短文章到手稿。它们都已被索引至段落级别…

一袭水袖舞倾城 2024-12-09 18:24:33 2 0

将 python 模块保留在内存中

我正在使用 python 自然语言工具包,其中有一个名为 pos_tag 的有用函数。您可以对从句子标记化的任何单词列表运行 nltk.pos_tag() ,它将返回包含句…

慕巷 2024-12-09 18:05:58 0 0

Python正则表达式nltk网站提取

您好,我以前从未处理过正则表达式,我正在尝试使用 Python 和 NLTK 预处理一些原始文本。 当我尝试使用以下方法标记文档时: tokens = nltk.regexp_t…

独孤求败 2024-12-08 13:41:07 0 0

NLTK“生成”功能:如何取回返回的文本?

我是一个 Python 菜鸟,所以请耐心等待。 我正在尝试使用 NLTK 库,特别是“生成”函数。从文档来看,该函数只是打印其结果( http://nltk.googlecode…

海的爱人是光 2024-12-08 04:40:48 0 0

NLTK 分块并遍历结果树

我正在使用 NLTK RegexpParser 从标记的标记中提取名词组和动词组。 如何遍历生成的树以仅查找 NP 或 V 组的块? from nltk.chunk import RegexpParse…

枯寂 2024-12-07 06:35:29 0 0

快速 n 元语法计算

我正在使用 NLTK 在语料库中搜索 n-gram,但在某些情况下需要很长时间。我注意到计算 n 元语法在其他软件包中并不是一个不常见的功能(显然 Haystack …

随风而去 2024-12-07 03:06:29 1 0

需要在Python中为语料库创建直方图

import nltk from nltk.book import * from nltk.corpus import brown corpus_text = brown.words() word_freq = FreqDist(corpus_text) word_hist = …

稳稳的幸福 2024-12-06 20:26:33 3 0

MALLET 与 NLTK 中的主题建模

我刚刚读了一篇关于如何使用 MALLET 进行主题建模的精彩文章,但我在网上找不到任何将 MALLET 与 NLTK 进行比较的内容,而我已经有一些经验了。 它们…

浅黛梨妆こ 2024-12-05 18:48:03 0 0

IronPython 2.7.1 beta 2 的外籍人士

我正在尝试让 NLTK 与 IronPython 2.7.1 一起使用。到目前为止,安装工作正常,但我尝试了一些示例代码,但缺少 expat 模块。有什么关于如何启动并运…

一袭水袖舞倾城 2024-12-05 15:20:25 0 0

从 Wordnet 中查找与给定单词相隔固定编辑距离的单词

我正在使用 nltk 和 wordnet 编写拼写检查器,我有一些拼写错误的单词“belive”。我想要做的是从 wordnet 中找到与该给定单词的 leveshtein 编辑距离…

凹づ凸ル 2024-12-05 08:26:01 2 0

NLTK 找不到 Java 可执行文件

我使用的是NLTK的nltk.tag.stanford,它需要调用java可执行文件。 我将 JAVAHOME 设置为安装了 jdk 的 C:\Program Files\Java\jdk1.6.0_25 ,但是当运…

梦亿 2024-12-04 12:12:59 2 0

nltk.corpus.wordnet 的哪个相似度函数适合查找两个单词的相似度?

nltk.corpus.wordnet 中的哪个相似度函数适合查找两个单词的相似度? path_similarity()? lch_similarity()? wup_similarity()? res_similarity()? jc…

苍暮颜 2024-12-04 10:54:00 2 0
更多

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文