text-processing

text-processing

文章 0 浏览 6

用java提取文本

如果我有下面的字符串,如何使用 java 提取 EDITORS PREFACE 文本?谢谢。 EDITORS PREFACE …

最好是你 2024-09-11 07:36:52 3 0

Perl 绘制 .csv 文件中的多个数据集

我有一个包含以下数据的 .csv 文件。(我将 CSV 文件作为逗号分隔文件打开) file1 date1 1 76.09 date10 10 87.09 date11 11 89.89 date2 2 66.5 dat…

不忘初心 2024-09-10 09:53:45 9 0

在 .NET 中以编程方式解析日志文件

我们有大量(读取:50,000)相对较小(读取低于 500K,通常低于 50K)的日志文件,这些日志文件是使用 log4net 从我们的客户端应用程序创建的。典型的…

禾厶谷欠 2024-09-09 07:56:26 7 0

如何计算两个文本/字符串之间的相似度或差异百分比?

进一步解释 假设我有两个如下所示的字符串 我是一个会飞的超级男孩!真的。 我是能打破墙壁的超级男孩! 真的。 所以有些角色是相似的 我是超级男孩 …

娇女薄笑 2024-09-09 05:33:03 2 0

使用Python分割运行文本中的单词?

我正在编写一段代码,将从运行文本中提取单词。该文本可以包含文本中可能存在的分隔符,例如 \r、\n 等。 我想丢弃所有这些分隔符,只提取完整的单词…

幸福还没到 2024-09-08 06:21:07 5 0

XSLT 2.0 正则表达式问题(不同匹配的开始和结束元素)

我已经稍微简化了问题,但我希望我仍然抓住了问题的本质。 假设我有以下简单的 XML 文件: outside1 ===BEGIN=== inside1 ====END==== outside2 =BEGI…

南冥有猫 2024-09-07 15:42:56 6 0

查找文本中最常见术语的简单工具

我有一篇文本,我想提取最常见的术语,即使由多个单词组成(即:总经理、职位、薪水、网络开发人员)。 我需要一个库或一个可安装的可执行文件,而不…

蒲公英的约定 2024-09-06 13:46:53 6 0

处理 ORed 文本

我正在使用库从 OCRed Tiff 文件中提取文本并将其转储到数据库中。我提取的文本实际上是具有 NAME、DOB、COUNTRY 等字段的表单。由于 OCR 无法区分实…

顾忌 2024-09-06 12:44:09 8 0

从文本文件中解析项目

我有一个文本文件,其中包含 {[]} 标记内的数据。解析该数据的建议方法是什么,以便我可以仅使用标签内的数据? 示例文本文件如下所示: “这是一堆在…

伪装你 2024-09-05 15:01:05 5 0

使用 Ruby 从文本中提取 URL,同时处理匹配的括号

URI.extract 声称可以执行此操作,但它无法处理匹配的括号: >> URI.extract("text here (http://foo.example.org/bla) and here") => ["http://foo.e…

青朷 2024-09-05 05:26:02 6 0

uʍop-ǝpᴉsdn 文本如何工作?

这是我发现的一个网站,可以生成任何英文文本的颠倒版本。 它是如何实现的工作? unicode有颠倒的字符吗?或者什么? 如何编写自己的文本翻转功能?…

暮年慕年 2024-09-04 21:02:23 2 0

阅读电子邮件内容

希望有人能够提供帮助。我想做的是用 C# 创建一个小型 winform 应用程序,以从 pop 帐户读取电子邮件的内容,并自动将键值上传到 sql。每封电子邮件的…

久隐师 2024-09-04 09:47:17 5 0

是否有任何众所周知的算法来检测名称的存在?

例如,给定一个字符串: “Bob 和他的朋友 Jim Smith 一起去钓鱼。” Bob 和 Jim Smith 都是名字,但 bob 和 smith 都是单词。如果它们不是大写,那么…

猫烠⑼条掵仅有一顆心 2024-09-03 15:09:50 8 0

用于查找未终止字符串的正则表达式

我需要在 CSV 文件中搜索以未终止的双引号字符串结尾的行。 例如: 1,2,a,b,"dog","rabbit 会匹配而 1,2,a,b,"dog","rabbit","cat bird" 1,2,a,b,"dog…

执笔绘流年 2024-09-03 02:21:33 4 0

内联 LaTeX \input 命令

我正在寻找一个程序来递归内联 LaTeX 文件中的所有 \input{} 命令。我所说的“递归”是指迭代地进行内联,直到最终的 LaTeX 文件中不再有 \input{} 命…

城歌 2024-09-02 18:31:28 13 0
更多

推荐作者

佚名

文章 0 评论 0

羁客

文章 0 评论 0

文章 0 评论 0

夏日落

文章 0 评论 0

隐诗

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文