text-processing

text-processing

文章 0 浏览 6

给定文档,选择相关片段

当我在这里提出问题时,自动搜索返回的问题的工具提示给出了问题的前一点,但其中相当一部分没有给出任何比理解问题更有用的文本。标题。有谁知道如何…

烟若柳尘 2024-09-01 14:45:12 11 0

Java文本分类问题

Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题?更新问题,以便可以通过编辑这篇文章用事实和…

秋心╮凉 2024-09-01 11:42:46 8 0

无趣单词列表

[警告]这不是一个直接的编程问题,但它是语言处理中经常出现的问题,我确信它对社区有一些用处。 有没有人有一个很好的无趣(英语)单词列表,这些单…

很酷不放纵 2024-08-29 18:50:52 13 0

从 XML 文件中删除标头的简单方法

我需要从另一个程序生成的文件中删除非 xml 标签。 该文件是这样的: Executing Command - Blah.exe ... -----Command Output----- HTTP/1.1 200 OK C…

猥琐帝 2024-08-29 18:33:11 5 0

以下自然语言处理术语的详细信息?

Named Entity Extraction (extract ppl, cities, organizations) Content Tagging (extract topic tags by scanning doc) Structured Data Extraction…

失而复得 2024-08-29 10:55:45 7 0

使用正则表达式从纯文本套用信函中提取变量?

我正在寻找一个在 PHP 中使用正则表达式来“逆向工程”套用信函(当然具有已知格式)的好例子,该套用信函已粘贴到多行文本框中并发送到脚本进行处理…

谁与争疯 2024-08-28 17:48:13 9 0

否定句子的算法

我想知道是否有人熟悉算法句子否定的任何尝试。 例如,给定一个句子“这本书很好”,请提供任意数量的意思相反的替代句子,例如“这本书不好”甚至“…

碍人泪离人颜 2024-08-28 09:18:43 18 0

在 Perl 中将混合的 ISO-8859-1 和 UTF-8 多行字符串强制转换为 UTF-8

考虑以下问题: 多行字符串 $junk 包含一些以 UTF-8 编码的行和一些以 ISO-8859-1 编码的行。我不知道先验哪些行采用哪种编码,因此需要启发式方法。 …

总攻大人 2024-08-27 06:34:49 7 0

tf-idf:我理解对吗?

我对进行一些文档聚类感兴趣,现在我正在考虑使用 TF-IDF 来实现此目的。 如果我没记错的话,TF-IDF 特别用于评估文档给定查询的相关性。如果我没有特…

老街孤人 2024-08-26 22:12:48 13 0

Unix 中的日志解析器/分析器

人们在 Unix 中使用什么流行工具来解析/分析日志文件?进行计数,找到唯一的,选择/复制具有特定模式的特定行。请推荐一些工具或一些关键字。因为我相…

海的爱人是光 2024-08-24 20:25:07 8 0

bash:从文本文件中过滤掉连续行

我想从许多文件中删除段落的每个实例。我将段落称为行序列。 例如: my first line my second line my third line the fourth 5th and last 问题是我…

雨巷深深 2024-08-24 19:47:53 8 0

sed:在某个位置上设置一个字符

这 sed "s/public \(.*\) get\(.*\)()/\1 \2/g" 会将其转换 public class ChallengeTO extends AbstractTransferObject { public AuthAlgorithm getAl…

意犹 2024-08-24 14:33:24 16 0

如何根据另一列中的值对列中的值求和?

我有一个文本文件: ABC 50 DEF 70 XYZ 20 DEF 100 MNP 60 ABC 30 我想要一个输出,它总结各个值并显示结果。例如,文件中所有 ABC 值的总和为 (50 + …

时光倒影 2024-08-22 15:28:28 11 0

处理非平面文件中的文本(提取信息,就好像它是平面文件一样)

我有一个由计算机模拟生成的纵向数据集,可以用下表表示(“var”是变量): time subject var1 var2 var3 t1 subjectA ... t2 subjectB ... 并且 sub…

梦言归人 2024-08-21 01:48:52 13 0

根据关键字选择要剪切的文本部分的最佳方法是什么?

当您在 Stackoverflow 中搜索某些内容时,它会剪切问题描述中最符合您的条件的部分,然后标记条件单词。 我想知道在 C# 中手动执行此操作的最佳方法,…

可爱咩 2024-08-20 21:39:18 9 0
更多

推荐作者

佚名

文章 0 评论 0

羁客

文章 0 评论 0

文章 0 评论 0

夏日落

文章 0 评论 0

隐诗

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文