在 Matlab 元胞数组中查找不同值的出现次数
我有一个包含两列(“日期”和“用户”)的数据文件:
date1 user1
date1 user1
date1 user2
date2 user1
date2 user2
...
我需要查找每个唯一的用户在特定日期执行操作的次数。我知道我可以使用 unique() 函数来查找整个不同的用户,然后对所有行运行 for 循环,检查是否相等,然后求和,但问题是我有超过 800 万行并运行 double循环的话就太贵了。
还有其他方法可以计算每个用户的日期出现次数吗?
I have a data file of two columns ('date' and 'user'):
date1 user1
date1 user1
date1 user2
date2 user1
date2 user2
...
I need to find how many times each unique user did the action at the certain date. I know I could use unique() function to find the whole distinct users and after to run the for loop through all the rows, check if equal and then sum up, but the problem is that I have more than 8mln rows and to run double loop it would be too expensive.
Is there any other way to count occurrences of date for each user?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
请始终说明您正在处理的数据类型是什么,最好使用示例。
我假设用户和日期都是组合在元胞数组中的字符串。
将 2 列合并为一列:
然后您可以计算出现次数:
注意 需要 MATLAB Statistics Toolbox grp2idx
Please always state what are the data types you are dealing with, better with an example.
I assume both users and dates are strings combined in a cell array.
Combine 2 columns into one:
Then you can count occurences:
Note MATLAB Statistics Toolbox is required for grp2idx
如果我正确理解了这个问题,请查看以下代码:
需要缓存大小(A, 1)(不确定 MATLAB 是否会为您执行此操作)。
If I understand the question correctly, check out the following code:
Cache size(A, 1) is needed (not sure if MATLAB will do that for you).