数据挖掘

数据挖掘

文章 108 浏览 70

sql或者python根据input输出output

题目如下:通过输入数据(input)对itemid的订单覆盖率进行排序,输出格式为output input: Orderid Itemid Quantity 001 aa 1 001 bb 1 002 aa 1 003 a…

北座城市 2022-09-12 00:15:54 12 0

sklearn里聚类的方法,dbscan和kmeans只适用于二维空间是吗?

问题描述 最近在做聚类方面的工作,手上是一个10维数组。需要尝试去聚类,然后组里的人用的是skleanr库里的dbscan和kmeans。他们的做法是直接把这个…

鸩远一方 2022-09-11 19:56:49 15 0

如何使用最少的请求实现两列相关数据的一一对应?

具体问题是这样的: 某个网站,uid和注册时间是正相关且单调,比如uid[1001-1100] 是 2016年6月6日注册的,uid[1101-1200] 是 2016年6月7日注册的。 …

骄傲 2022-09-11 19:05:40 9 0

图片识别时,如何进行数据清洗?

我们进行深度学习训练时,将标记好的图片,批量进入神经网络进行训练。之前没有进行数据清洗,效果很差。但是不明白的是,图片是如何进行数据清洗的?…

冷…雨湿花 2022-09-11 18:16:57 15 0

LDA主题模型适用于处理大量数据的应用吗,处理100多万条短数据,想知道会不会特别耗时

LDA主题模型适用于处理大量数据的应用吗,处理100多万条短数据(每条大概30 40个字),想知道会不会特别耗时…

执妄 2022-09-11 18:11:26 33 0

数据挖掘100多万条记录的数据集中高效查找每一条记录所属用户的近一周、近一月的记录数或其他信息? 我用的类似于两层循环太耗时

数据挖掘特征提取 100多万条记录的数据集中高效查找每一条记录所属用户的近一周、近一月的记录数或其他信息(作为特征)? 我用的类似于两层循环太耗…

浅忆流年 2022-09-11 18:03:06 25 0

Pandas中,将Series添加到空DataFrame后变量顺序发生不期望的改变?

原因已经找到了,在不事先设置好DataFrame的列标签时,append到数据框中的变量顺序会被自动调整 df = pd.DataFrame() series=pd.Series([3,4,1,6],in…

病女 2022-09-11 17:44:57 9 0

如何使用pandas查找具体的值?

对于一个具体的人,知道其性别、有无糖尿病,血压,年龄,胆固醇等,如何在pandas里索引出他的具体值?至少有6个变量,十分的坑爹如图,我已经把表格…

迷离° 2022-09-11 17:43:44 10 0

分类模型,模型评估指标KS的画图中有交叉是否正确?

我再利用真正例率和假正例率计算KS的时候发现,这两跟曲线会交叉,平时看到别人的都没有交叉,是我的代码错了?还是我的数据表现就是这样的?这个是…

夏了南城 2022-09-11 17:33:29 11 0

pandas 如何根据A表的出现的某列值,查询B表的数据

如何在pandas中,根据A dataframe的ID,查询B dataframe中的数据,A和B表存在同样的ID列。类似于SQL的列级子查询:select * from t_class where c_id i…

明媚如初 2022-09-11 15:20:15 11 0

pycharts饼图 如何实现 添加各个部分的标签信息

from pyecharts import Pie attr = ['2d', '3d']v1 = [12, 5]pie = Pie("中国2017电影视觉类型比例",title_pos='left',title_text_size=15,width=100…

七婞 2022-09-11 15:05:19 22 0

百度面试题,如何快速找出文件(大文件无法一次性读取)中的重复项?

百度面试题,大致意思是说,有个文件,文件很大不能一次性读取(可能是不能一次性加载到内存中),文件中存放的是IP地址,如何快速找出重复的IP地址…

独木成林 2022-09-07 16:26:15 29 0

如何获取全国或者某个省市的经纬度坐标数组

我的目的是:获取全国或者某个省市的经纬度坐标数组, 且这些坐标数组间隔为3公里。(换句说法,以3公里为半径画圆, 近似地填充整个省市或国家) 我目前…

心房敞 2022-09-07 11:39:51 11 0

如何使car evaluation数据集被kmeans聚类

car evaluation数据集是hfh免费提供的一个数据集。我现在通过学习《机器学习实战》这本书,想通过kmeans对这个数据集进行聚类,发现,因为car数据集…

手心的温暖 2022-09-07 04:30:53 9 0

请问聚类分析有没有公开的商业数据集可以用?

进行客户分类的数据集。谢谢大家…

温柔一刀 2022-09-06 20:28:26 11 0
更多

推荐作者

花开柳相依

文章 0 评论 0

zyhello

文章 0 评论 0

故友

文章 0 评论 0

对风讲故事

文章 0 评论 0

Oo萌小芽oO

文章 0 评论 0

梦明

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文