text-processing

text-processing

文章 0 浏览 6

从文章中提取关键词

我在 MySQL 中存储了文章和关键字。该网站将对新文章进行预处理,以查找有多少个匹配的关键字,然后更新存储与该文章相关的相关关键字的表。然后,这…

吻风 2024-11-14 03:01:23 5 0

从 WHOIS 查询响应中自动提取域名注册人

我正在寻求开发一个系统,可以从 WHOIS 响应中检索域名注册人的姓名(最好是电子邮件地址)。从头开始手动编写 WHOIS 解析器似乎是一项艰巨的工作,因…

苍景流年 2024-11-11 18:41:55 3 0

Apache Tika 和解析文档时的字符限制

有人可以帮我解决一下吗? 可以这样完成 Tika tika = new Tika(); tika.setMaxStringLength(10*1024*1024); 但是如果你不直接使用Tika,就像这样: Co…

阳光下慵懒的猫 2024-11-09 19:40:55 6 0

使用 Javascript 将链接更改为关键字

我想将网址文本更改为单词,但不知道该怎么做。请帮我。 这就是我想做的,例如: some-text-url.html 到 some text url…

緦唸λ蓇 2024-11-09 08:07:44 4 0

如何提取嵌入非表格文本文件中的表格数据?

有几千个报告,其中嵌入了我需要提取的一致格式的表格数据。 有一些想法,但我想我应该发帖看看是否有比我想的更好的方法;这是提取表格数据,为其创…

尘世孤行 2024-11-08 16:11:27 10 0

perl - 将字符串拆分为 2 个字符组

可能的重复: 如何拆分在 Perl 中将字符串分成每个两个字符的块? 我想将一个字符串拆分为一个数组,并按 2 个字符的片段对其进行分组: $input = "D…

卸妝后依然美 2024-11-07 22:53:13 5 0

无需额外软件即可处理 Windows 文本?

我有这些输出大量数据的机器。不幸的是,输出的文件的结构很奇怪。我希望能够进行一些复杂的文本处理(perl 样式)来解析数据并能够输出为 Excel 格式…

你与清晨阳光 2024-11-06 23:15:45 7 0

比较两个文件

我有两个这种格式的文件, file1= filename val1 val2 file2= filename val3 val4 我想比较文件名,如果它们具有相同的名称,我想获得像这样的第三个…

三生路 2024-11-05 12:41:57 3 0

在 Python 的 ASCII 文件中查找/替换带注释的子字符串

我在正在进行的生物信息学项目中遇到了一些编码问题。基本上,我的任务是从数据库中提取基序序列并使用该信息来注释序列比对文件。比对文件是纯文本,…

肩上的翅膀 2024-11-05 09:29:34 7 0

正则表达式不匹配

在这种情况下我遇到了正则表达式的问题: 我需要从这样的构造中提取(并替换)所有点: any_symbols->white_space->x.(or xx. or Xx. or xX. or xy. o…

长伴 2024-11-05 09:16:48 4 0

文本字符串的内容分离

我将这个 "&params=&offer=art-by-jeremy-johnson" 存储在我的数据库中。 是否有任何函数/方法可以使用上述内容作为输入值来获取 "Art by Jeremy John…

风透绣罗衣 2024-11-02 17:19:27 2 0

使用 Python 合并两个文本文件

我尝试迭代两个不同的文本文件,并根据两个文件中每一行开头找到的帐号创建一个合并文件。我首先读取包含报表数据的主文件并读取每一行,直到找到与前…

﹏雨一样淡蓝的深情 2024-11-02 15:46:00 7 0

在 Bash 中根据列值过滤行

我有一个 bash 脚本,它输出一些基于列的信息。我想为用户提供一些选项来匹配特定列的值。例如,./myColumnDump可能会打印 User Job_name Start_day a…

赠我空喜 2024-11-02 11:46:47 4 0

生成和打印身份证时文本模糊

我正在通过 .NET 生成 ID 卡,但遇到一个问题,我插入的动态文本显得非常模糊,以至于我必须使用粗体字体才能勉强接受。 我目前正在做的事情: 抓取图…

尴尬癌患者 2024-10-30 20:29:38 3 0

如何将文本插入conf文件?

在 nginx.conf 中,我有: server { listen 81; ...snip... } 我希望文件看起来像这样: server { listen 81; if (-f $document_root/system/maintena…

长亭外,古道边 2024-10-29 09:20:32 6 0
更多

推荐作者

qq_2gSKZM

文章 0 评论 0

∞梦里开花

文章 0 评论 0

qq_IklFPL

文章 0 评论 0

迷途知返

文章 0 评论 0

深海不蓝

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文