text-segmentation

text-segmentation

文章 0 浏览 3

Haskell 文件读取

我最近刚刚开始学习 Haskell,在尝试弄清楚文件读取的工作原理时遇到了很多麻烦。 例如,我有一个文本文件“test.txt”,其中包含带有数字的行: 32 4…

旧故 2024-12-11 11:24:54 2 0

获取完整的unicode句子

我正在尝试解析像 Base: Lote Numero 1, Marcelo T de Alvear 500. Demanda: otras palabras. 这样的句子。我想:首先,按句点分割文本,然后使用任何…

原来分手还会想你 2024-12-08 22:16:06 3 0

如何从 php 字符串中删除第一个单词

我想使用 PHP 删除字符串中的第一个单词。 尝试搜索但找不到我能理解的答案。 例如:“White Tank Top”因此变成“Tank Top”…

懒的傷心 2024-11-25 22:41:00 2 0

使用正则表达式进行句子分割

我有一些文本(SMS)消息,我想使用句点('.')作为分隔符对它们进行分段。我无法处理以下类型的消息。如何使用 Python 中的正则表达式对这些消息进行…

温暖的光 2024-11-24 19:36:23 1 0

解析连续字符串中的单词

如果 a 有一个包含单词且没有空格的字符串,那么鉴于我有一个包含这些单词的字典/列表,我应该如何解析这些单词? 例如,如果我的字符串是“thisisast…

洋洋洒洒 2024-11-16 08:40:51 2 0

将字符串转换为单词列表?

我正在尝试使用 python 将字符串转换为单词列表。我想采用如下所示的内容: string = 'This is a string, with words!' 然后转换为如下所示的内容: l…

素食主义者 2024-11-10 13:24:35 6 0

在句子边界分割文本文件

我必须处理一个文本文件(一本电子书)。我想对其进行处理,以便每行有一个句子(“换行符分隔的文件”,是吗?)。我如何使用 UNIX 实用程序 sed 来…

唱一曲作罢 2024-10-31 07:21:16 7 0

DP 的递推关系?

假设您有一本包含有效单词的字典。 给定一个删除了所有空格的输入字符串,确定该字符串是否由有效单词组成。 您可以假设字典是一个提供 O(1) 查找的哈…

零度℉ 2024-10-30 23:38:53 6 0

php句子边界检测

我想用 PHP 将文本分成句子。我目前正在使用正则表达式,它的准确率约为 95%,并且希望通过使用更好的方法来改进。我见过用 Perl、Java 和 C 实现此目…

爱殇璃 2024-10-17 21:53:11 13 0

高棉语分词的可行解决方案?

我正在研究一种解决方案,将高棉语(柬埔寨语言)的长行拆分为单个单词(UTF-8 格式)。高棉语单词之间不使用空格。有一些解决方案,但它们还远远不够…

北音执念 2024-10-15 06:14:55 10 0

搜索段落中的句子

如何使用 PHP 在段落中搜索一个或多个句子?…

虐人心 2024-09-15 04:59:31 6 0

如何将字符串拆分为单词。例如:“stringintowords” -> 《串成文字》?

将字符串拆分为单词的正确方法是什么? (字符串不包含任何空格或标点符号) 例如:“stringintowords”-> “串成单词” 您能建议这里应该使用什么算…

ぺ禁宫浮华殁 2024-09-13 20:54:54 14 0

如何使用 NLP 将非结构化文本内容分成不同的段落?

以下非结构化文本具有三个不同的主题:史泰龙、费城和美国革命。但是您会使用哪种算法或技术将此内容分成不同的段落? 分类器在这种情况下不起作用。…

青瓷清茶倾城歌 2024-09-09 23:55:26 10 0

从字符串中提取单词的正则表达式

我想从 java 字符串中提取所有单词。 单词可以用任何欧洲语言书写,并且不包含空格,仅包含字母符号。 但它可以包含连字符。…

可遇━不可求 2024-09-07 14:45:38 9 0

Java中使用正则表达式匹配句子

我正在使用 java 中的 Scanner 类来遍历文本文件并提取每个句子。我在我的扫描仪上使用 setDelimiter 方法来处理正则表达式: Pattern.compile("[\\w]…

飘逸的'云 2024-08-29 02:08:50 12 0
更多

推荐作者

Gabu-gabumon

文章 0 评论 0

qq_CgiN62

文章 0 评论 0

荔枝明

文章 0 评论 0

¤→小豸慧

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文