返回介绍

数据挖掘案例

发布于 2024-10-03 10:40:20 字数 3423 浏览 0 评论 0 收藏 0

大数据挖掘案例列表

表格 11 大数据挖掘案例列表

案例名称背景与挖掘目标数据获取数据预处理模型构建模型检验模型应用
电力窃漏电用户自动识别目标:自动检查、判断用户是否存在漏电行为。营销系统获取用户数据;电力计量自动化系统获取实时用电数据。异常值~拉氏插值。 指标:电量趋势下降指标、线损率、告警类指标LM 神经网络或 DT 决策树分类结果的混淆矩阵。 ROC 曲线 
航空公司客户价值分析客户分类; 比较客户价值;客户个性化服务。客户基本信息;乘机信息;积分信息。航空公司 LRFMC 模型或 RFM 模型。K 中心聚类 会员升级与保级;首次兑换;交叉销售。
中医证型关联规则挖掘挖掘患者症状与中医证型之间的关联关系。问卷调查。证型系数;数据离散化关联规则  
基于水色图像的水质评价基于计算机视觉,以专家经验为基础,水质分级判别。采集图像。图像特征:颜色图像切割和颜色矩特征提取。 颜色直方图。SVM  
家电电器用户行为分析与事件识别识别用户热水器采集属性构造(4 类属性指标:时长、频率、用水的量化、用水的波动)神经网络  
应用系统负载分析与磁盘容量预测 CPU/内存/磁盘使用信息 平衡性检验、白噪声检验、模型识别检验残差序列是否为白噪声容量预测
电子商务网站用户行为分析及服务推荐用户访问推荐用户访问日志 推荐系统(协同过滤 CF)  
财政收入影响因素分析及预测模型识别影响财务收入的关键特征 相关系数矩阵回归;神经网络 灰色预测
基于基站定位数据的商圈分析对基站分群; 对商圈分群。移动运营商提供的接口数据 谱系聚类  
电商产品评论数据情感分析分析某产品的用户情感倾向。从评论中挖掘出产品优劣点。某产品的文本评论数据文本去重;文本机械压缩去词;短句删除;文本分词。神经网络语言模型 NNLM;语义网络分析;LDA 主题模型  
       
案例名称背景与挖掘目标数据获取数据预处理模型构建模型检验模型应用

备注:

  1. ROC:受试者工作特征曲线 (receiver operating characteristic curve,简称 ROC 曲线),又称为 感受性 曲线(sensitivity curve)。以假阳性概率(False positive rate)为 横轴 ,击中概率为纵轴所组成的坐标图,和被试在特定刺激条件下由于采用不同的判断标准得出的不同结果画出的曲线。在 ROC 曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。曲线下面积越大越准确。

  2. 航空公司 LRFMC 模型:用来识别客户价值的五个指标。统计时间段为观察窗口时间,一般单位为月。

模型LRFMC
LRFMC会员入会时间 距观察窗口结束的月数客户最近一次坐飞机--飞行次数总飞行里程乘坐舱位所对应的平均折扣系数
  1. 图像特征包括颜色、纹理、形状和空间关系特征等等。颜色特征主要包括颜色直方图和颜色矩方法。一幅图像的色彩分布也可认为是一种概率分布,因此图像可以用其各阶矩来表示。对于一幅 RGB 颜色空间的图像,具有 R/G/B 三个颜色通道,9 个分量。
  • 颜色直方图反应的是图像中颜色的组成分布。
  • 颜色矩包括各个颜色通道的一、二、三阶矩。一阶颜色矩采用一阶原点矩,反映图像的整体明暗程度;二阶颜色矩采用二阶中心矩的平方根,反映图像颜色的分布范围;三阶颜色矩采用三阶中心矩的立方根,反映图像颜色分布的对称性。

本章参考

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文