总结数据框中的因素
我的数据集如下: http://dl.dropbox.com/u/822467/Data .csv
我的情况是这样的。我有一系列问题(总共 27 个),其答案本质上是二元的。 0=否,1=是,999=缺失。
我的第一个问题是如何将所有列变成因子。我可以使用 as.factors
一项一项地完成它们,但这需要很长时间。
我的第二个问题是,我需要一个摘要,其中问题作为标题,是和否作为第一列,并且单元格中填充了每个问题的“是”和“否”的频率。
我还需要另一个带有 % 的数据框。非常感谢我能得到的任何帮助。我查看了 Hmisc 的包摘要和摘要等,但没有效果。
My dataset is as below: http://dl.dropbox.com/u/822467/Data.csv
My situation is this. I have a series of questions (27 in all) where the response is binary in nature. 0=No, 1=Yes, 999=Missing.
My first problem is how to turn all columns into factors. I can do them one by one using as.factors
but it takes forever.
My 2nd problem is that I need a summary with the Questions as headers and Yes and No as the first column and the cells are filled with the frequency of Yes and No for each question.
I would also need another dataframe with the %. Greatly appreciate any help I can have. I've looked into Hmisc's package summarize and summary and so onto no avail.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
四行代码......
产生以下结果:
Four lines of code...
... produces this result:
要将所有列转换为因子,您可以使用
lapply
并转换回 data.frame,因为 data.frame 与列表非常相似:对于其余部分,我同意 Andrie 的评论......你有吗尝试过
table
功能吗?您可能会感兴趣。To turn all your columns to factor, you can use
lapply
and convert back to data.frame, as data.frames are very similar to lists :For the rest i agree with Andrie's comment ... Have you tried the
table
function ? It might interest you.这是使用
reshape2
的另一个解决方案。Here is a another solution using
reshape2
.