当前位置：文江博客话题详情

LibSVM 输入格式

发布于 2024-10-21 10:16:11 字数 309 浏览 7 评论 0原文

我想在文件中表示一组标记实例（数据），并将其作为训练数据输入到 LibSVM 中。对于这个问题中提到的问题。它将包括：

登录日期
登录时间
位置（国家/地区代码？）
星期几
真实性（0 - 不真实，1 - 真实） - 标签

如何格式化要输入到 SVM 的数据？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

澜川若宁 2024-10-28 10:16:11

您是问数据格式还是如何转换数据？对于后者，您将必须进行试验才能找到正确的方法来做到这一点。总体思路是将数据转换为名义或有序值属性。其中一些很简单 - #4、#6 - 其中一些会很困难 - #1-#3。

例如，您可以将 #1 表示为日、月和年的三个属性，或者通过将其转换为类似 UNIX 的时间戳来仅表示一个属性。

IP 甚至更难 - 没有直接的方法将其转换为有意义的序数值。根据您的问题，使用每个 IP 作为标称属性可能没有用。

一旦你弄清楚了这一点，就可以转换你的数据，检查 LibSVM 文档。一般格式如下：即+1 1:0 2:0 ..等

回复收藏 0 原文

心如荒岛 2024-10-28 10:16:11

我相信前面的答案中有一个未阐明的假设。未声明的假设是 libSVM 的用户知道他们应该避免将分类数据放入分类器中。

例如，libSVM 将不知道如何处理国家/地区代码。如果您试图预测哪些访问者最有可能在您的网站上购买商品，那么如果美国位于您的国家/地区代码列表中的乍得和尼日尔之间，您可能会遇到问题。美国的经济增长可能会影响对其周边国家的预测。

为了解决这个问题，我将为每个正在考虑的国家创建一个类别（也许还有一个“其他”类别）。然后，对于要分类的每个实例，我会将除该实例所属的国家/地区类别之外的所有国家/地区类别设置为零。（对于 libSVM 稀疏文件格式来说，这并不是什么大问题）。

回复收藏 0 原文

~没有更多了~

关于作者

娇妻

暂无简介

0 文章

0 评论

25 人气

关注发私信

友情链接

文江博客

LibSVM 输入格式

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

娇女薄笑

biaggi

xiaolangfanhua

rivulet

我三岁

薆情海

友情链接

LibSVM 输入格式

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

娇女薄笑

biaggi

xiaolangfanhua

rivulet

我三岁

薆情海

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。