IBM Cloud Watson Discovery:相关性训练从未成功运行

发布于 2025-01-11 05:38:52 字数 491 浏览 0 评论 0原文

我将包含 9 个文档的 CSV 文件上传到 Watson Discovery 中的集合。我尝试使用一些查询来搜索该集合,但尽管返回了正确的文档,但置信度确实很低(0.01 -> 0.02)。这让我接受了相关性培训。我输入了大约 60 个问题并对返回的结果进行评分(在改进工具面板上)。然而,在我看来,训练似乎从未开始。 IBM不断展示“IBM将很快开始学习”。 这是通过 python-sdk API 检查的项目状态。这样的情况已经持续了好几天了。 输入图片此处描述

我的问题是:

  1. 相关性培训可能出现什么问题,导致培训过程无法运行?
  2. 置信度是0.01->对于未经训练的集合(未经训练的策略),0.02 是正常的吗?

先感谢您。

I uploaded a CSV file containing 9 documents to a collection in Watson Discovery. I've tried searching this collection with some queries but the confidences are really low(0.01 -> 0.02), despite returning the correct document. That led me to Relevancy training. I input around 60 questions and rate the returning results (on the Improvement tools panel). However, it seems to me that the training never starts. IBM keeps showing "IBM will begin learning soon".
Here is the project status checked by python-sdk API. It has been like this for a couple of days.
enter image description here

My questions are:

  1. What could be possibly wrong with the relevancy training that lead to the training process not running?
  2. Is confidence of 0.01 -> 0.02 normal for an untrained collection (untrained strategy)?

Thank you in advance.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

2025-01-18 05:38:52

原来是文档格式不对。我的同事上传了一个包含 HTML 代码的 CSV 文件,但 IBM Discovery 似乎不喜欢它。

我将它们转换为一组 pdf 文件,它可以工作。

It turns out that the format of the document is off. My coworker uploaded a CSV file with HTML code and IBM Discovery doesn't seem to like it.

I converted them to a set of pdf files and it works.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文