information-extraction

information-extraction

文章 0 浏览 2

从数百万个简单但不一致的文本文件中提取信息

我们有数百万个简单的 txt 文档,其中包含从 pdf 中提取的各种数据结构,文本是逐行打印的,因此所有格式都会丢失(因为当我们尝试使用工具来维护格式…

剑心龙吟 2024-11-05 06:50:09 2 0

从html中提取基本信息?

我有一个项目,用户向外部站点提交许多链接,我需要解析这些提交链接的 HTML,并从页面中提取基本信息,就像 Digg 和 Facebook 在提交链接时所做的那…

萌辣 2024-11-03 05:30:24 1 0

是否有库可以协助 AutoCAD 结构提取?

我需要查询 AutoCAD 模型以提取它们之间的结构和连接(例如电源、数据),以便存储在数据库中。我从经验和研究中知道,由于格式的专有性质,处理原生 …

只有一腔孤勇 2024-11-02 12:17:49 3 0

信息提取。计算提及次数以衡量相关性

是否可以计算某个实体在一篇文章中被提及的次数?例如 ABC 公司是全球最大的汽车制造商之一 世界。 它也是最大的 公司的年产量。 它也是仅次于 XYZ 的…

风尘浪孓 2024-11-02 08:18:11 1 0

R:本体和网络提取的数据结构

我想从大型网站中提取信息并生成本体。可以用描述逻辑处理的东西。 对于提取的 html 数据,什么数据结构是合适的? 我的想法还: - 使用数据框、表结…

蓝颜夕 2024-10-24 12:05:37 1 0

图像特征识别

我正在寻找执行以下操作的解决方案:( 我的问题的重点是步骤 2。) 包括前院的房子的图片 从图片中提取信息,例如房屋、树木、人行道和汽车的尺寸和…

素食主义者 2024-10-15 23:41:46 5 0

最好的交钥匙关系检测库?

什么是最好的交钥匙(即用型、工业强度)关系检测库? 我一直在玩NLTK,但得到的结果不是很令人满意。 http://nltk.googlecode.com/svn/trunk/doc/boo…

秉烛思 2024-10-12 21:18:26 2 0

使用 Amazon BrowseNodes API 做一些有意义的事情

我有一个网站(www.7bks.com),人们可以在其中创建图书列表。目前这相当简单。我已经在使用 Amazon API 将图书信息、图像等提取到网站上。 我想要做…

白芷 2024-10-11 05:47:09 3 0

了解 OpenCalais 的相关性分数

我试图了解 opencalais 返回的与每个实体相关的相关性分数是多少?它意味着什么以及如何解释?我将感谢对此的见解。…

深居我梦 2024-10-11 00:26:59 5 0

用于非英语术语提取的开源选项?

我正在寻找一个可以使用多种语言进行术语提取的开源项目。 我已经找到了 Yahoo BOSS 术语提取 Web 服务,它是好的。但是,它不处理英语以外的语言。 …

拔了角的鹿 2024-10-10 08:00:49 2 0

DBpedia信息抽取框架

Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题吗?通过编辑这篇文章来更新问题,使其…

高跟鞋的旋律 2024-10-02 03:19:06 3 0

我如何开始信息提取?

在信息提取方面我是一个新手。这几天看了很多学术论文,还订了一本NLP方面的书。我想弄清楚如何构建一个类似 FlipDog.com 的系统(希望不是从头开始)…

飘逸的'云 2024-09-25 00:44:39 2 0

从爬网站点中提取图形(ARC 文件)

我正在处理由 Heritrix 爬网生成的 ARC 文件。当我在 Wayback Machine 中查看这些页面时,看起来大部分图形都是从我的本地计算机加载的,因此我假设这…

蓝咒 2024-09-06 02:06:20 11 0

信息提取工具包

Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…

信仰 2024-08-30 12:22:03 6 0

使用 Ruby 从文本中解析日期

我正在尝试弄清楚如何使用 Ruby 从非结构化文本中提取日期。 例如,我想解析此字符串“不考虑 2010 年 2 月 1 日午夜 12:00(东部标准时间)之后启动…

栀子花开つ 2024-08-21 09:32:09 10 0
更多

推荐作者

留蓝

文章 0 评论 0

18790681156

文章 0 评论 0

zach7772

文章 0 评论 0

Wini

文章 0 评论 0

ayeshaaroy

文章 0 评论 0

初雪

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文