第 4 页 - 数据挖掘

投稿关注

数据挖掘

文章 108 浏览 74

sql或者python根据input输出output

题目如下：通过输入数据(input)对itemid的订单覆盖率进行排序，输出格式为output input: Orderid Itemid Quantity 001 aa 1 001 bb 1 002 aa 1 003 a…

北座城市 2022-09-12 00:15:54 21 0

sklearn里聚类的方法，dbscan和kmeans只适用于二维空间是吗？

问题描述最近在做聚类方面的工作，手上是一个10维数组。需要尝试去聚类，然后组里的人用的是skleanr库里的dbscan和kmeans。他们的做法是直接把这个…

鸩远一方 2022-09-11 19:56:49 18 0

如何使用最少的请求实现两列相关数据的一一对应？

具体问题是这样的：某个网站，uid和注册时间是正相关且单调，比如uid[1001-1100] 是 2016年6月6日注册的，uid[1101-1200] 是 2016年6月7日注册的。 …

骄傲 2022-09-11 19:05:40 13 0

图片识别时，如何进行数据清洗？

我们进行深度学习训练时，将标记好的图片，批量进入神经网络进行训练。之前没有进行数据清洗，效果很差。但是不明白的是，图片是如何进行数据清洗的？…

冷…雨湿花 2022-09-11 18:16:57 21 0

LDA主题模型适用于处理大量数据的应用吗，处理100多万条短数据，想知道会不会特别耗时

LDA主题模型适用于处理大量数据的应用吗，处理100多万条短数据（每条大概30 40个字），想知道会不会特别耗时…

执妄 2022-09-11 18:11:26 46 0

数据挖掘100多万条记录的数据集中高效查找每一条记录所属用户的近一周、近一月的记录数或其他信息？我用的类似于两层循环太耗时

数据挖掘特征提取 100多万条记录的数据集中高效查找每一条记录所属用户的近一周、近一月的记录数或其他信息（作为特征）？我用的类似于两层循环太耗…

浅忆流年 2022-09-11 18:03:06 33 0

Pandas中，将Series添加到空DataFrame后变量顺序发生不期望的改变？

原因已经找到了，在不事先设置好DataFrame的列标签时，append到数据框中的变量顺序会被自动调整 df = pd.DataFrame() series=pd.Series([3,4,1,6],in…

病女 2022-09-11 17:44:57 14 0

如何使用pandas查找具体的值？

对于一个具体的人，知道其性别、有无糖尿病，血压，年龄，胆固醇等，如何在pandas里索引出他的具体值？至少有6个变量，十分的坑爹如图，我已经把表格…

迷离° 2022-09-11 17:43:44 16 0

分类模型，模型评估指标KS的画图中有交叉是否正确？

我再利用真正例率和假正例率计算KS的时候发现，这两跟曲线会交叉，平时看到别人的都没有交叉，是我的代码错了？还是我的数据表现就是这样的？这个是…

夏了南城 2022-09-11 17:33:29 15 0

pandas 如何根据A表的出现的某列值，查询B表的数据

如何在pandas中，根据A dataframe的ID，查询B dataframe中的数据，A和B表存在同样的ID列。类似于SQL的列级子查询:select * from t_class where c_id i…

明媚如初 2022-09-11 15:20:15 19 0

pycharts饼图如何实现添加各个部分的标签信息

from pyecharts import Pie attr = ['2d', '3d']v1 = [12, 5]pie = Pie("中国2017电影视觉类型比例",title_pos='left',title_text_size=15,width=100…

七婞 2022-09-11 15:05:19 30 0

百度面试题，如何快速找出文件(大文件无法一次性读取)中的重复项？

百度面试题，大致意思是说，有个文件，文件很大不能一次性读取（可能是不能一次性加载到内存中），文件中存放的是IP地址，如何快速找出重复的IP地址…

独木成林 2022-09-07 16:26:15 36 0

如何获取全国或者某个省市的经纬度坐标数组

我的目的是：获取全国或者某个省市的经纬度坐标数组, 且这些坐标数组间隔为3公里。(换句说法，以3公里为半径画圆, 近似地填充整个省市或国家) 我目前…

心房敞 2022-09-07 11:39:51 19 0

如何使car evaluation数据集被kmeans聚类

car evaluation数据集是hfh免费提供的一个数据集。我现在通过学习《机器学习实战》这本书，想通过kmeans对这个数据集进行聚类，发现，因为car数据集…

手心的温暖 2022-09-07 04:30:53 13 0

请问聚类分析有没有公开的商业数据集可以用？

进行客户分类的数据集。谢谢大家…

温柔一刀 2022-09-06 20:28:26 20 0

共 8 页
上一页
2
3
4
5
6
下一页

友情链接

文江博客