text-extraction

text-extraction

文章 0 浏览 6

如何使用 RegEx 从 HTML 中提取值?

给定以下 HTML: OAK RIDGE, N.J., March 16, 2011 /PRNewswire/ -- Lakeland Bancorp, Inc. (Nasdaq: LBAI), the holding company for Lakeland Bank…

薆情海 2024-10-22 00:43:29 11 0

Java 自动提取电子邮件

如何使用 Java 扫描文本文件中的潜在电子邮件地址?…

话少心凉 2024-10-20 00:25:36 8 0

将文件的行分割成二维,其中行元素由字符串长度确定,因为没有分隔符

我使用 file() 读取数据并迭代每一行。需要能够将字符串拆分为“列”数组。问题是列的宽度不均匀(60 个字符、24 个字符、16 个字符)。似乎所有执行…

も星光 2024-10-19 06:08:48 9 0

如何使用 grep、正则表达式或 perl 提取符合模式的字符串

我有一个看起来像这样的文件: 我需要提取 name= 后面的引号内的任何内容,即 content_analyzer、content_analyzer2 和content_analyzer_items。 我在…

若能看破又如何 2024-10-18 23:17:07 5 0

SWF 文件中的 OCR。有可能吗?

我需要从 SWF 文件中提取一些文本。有可能吗?有没有可以做到这一点的图书馆? 如果是,用哪种编程语言?…

西瓜 2024-10-18 09:13:57 5 0

使用 C# .net 添加规则并从 PDF 中提取文本

我想构建一个与此应用程序具有类似功能的 PDF 文本提取工具(A-PDF Data Extractor) http://www.a-pdf.com/data-extractor/index.htm 我计划在 c# .n…

只怪假的太真实 2024-10-17 18:19:21 7 0

获取字符串中最后一次出现空格后的子字符串

echo $cookie[4]; 结果: #HttpOnly_bacohuracm FALSE / TRUE 0 PHPSESSID 3A8DB8BE067954EE327A56F7F8D8B19C 我想删除这部分: #HttpOnly_bacohuracm…

肤浅与狂妄 2024-10-16 21:31:07 7 0

解析带扩展名的文件名,以隔离前导字符和数字后缀,不带扩展名

我当前的代码: $path2 = $file_list1; $dir_handle2 = @opendir($path2) or die("Unable to open $path2"); while ($file2 = readdir($dir_handle2))…

森末i 2024-10-16 15:35:50 6 0

解析包含 3 个分隔符的字符串

我有一个二维数组,它是从字符串中分解出来的。一旦它爆炸,这就是输出: ---> 0 - 16~4~0.0~~~~false~~~~ ---> 1 - 1000.0~21.75~L~1~2.0~2.0~L~2~ -…

对你再特殊 2024-10-16 14:06:22 7 0

匹配文件路径字符串中指定目录名称后的 3 个子目录名称

/any_string/any_string/any_number 带有此正则表达式: /(\w+).(\w+).(\d+)/ 它有效,但我需要这个网址: /specific_string/any_string/any_string/a…

木格 2024-10-16 06:48:37 8 0

使用 C# 读取图像中的文本(数据)

Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题吗?通过编辑这篇文章来更新问题,使其…

心房敞 2024-10-16 06:00:54 4 0

谷歌地图在php中获取坐标的问题

这是在 php 上,我在数组上有以下变量, Array ( [0] => { "name": "BRAVO Mario1050 [1] => Capital Federal [2] => Argentina" [3] => "Status": { …

琴流音 2024-10-14 05:39:15 10 0

保持“长” PDFBox 文本提取中的空格

我正在使用 PDFBox 从 PDF 中提取文本。 PDF有一个表格结构,非常简单,列之间的间隔也很宽, 这非常有效,除了所有类型的水平空间都会转换为单个空格…

无悔心 2024-10-11 09:18:34 12 0

如何使用正则表达式提取子字符串

我有一个字符串,其中有两个单引号,即 ' 字符。单引号之间是我想要的数据。 如何编写正则表达式从以下文本中提取“我想要的数据”? mydata = "some …

囚你心 2024-10-11 05:02:31 16 0

来自二进制文件提取库的通用纯文本

我正在寻找通用的非专用纯文本文件提取器。 首先,在人们大喊 Apache Tika 之前 - 我的回答是它只支持一些流行的二进制文件格式,如 Office、BMP 等。…

七颜 2024-10-08 21:05:48 5 0
更多

推荐作者

饮湿

文章 0 评论 0

明月

文章 0 评论 0

02

文章 0 评论 0

hs1283

文章 0 评论 0

风向决定发型

文章 0 评论 0

落花浅忆

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文