根据 R 中可能出现的顺序自动重新编码变量值
我正在处理 R 中多项调查的数据。这些调查包含用不同语言完成的相同问题。对于某些问题,表示相同答案的选择已保存在不同的值下,我想对这些问题重新编码,以便它们在调查中保持相同。
例如,参与者必须选择他们居住的国家(从 195 个选项中选择)。在英语版本中,如下所示:
调查中选择的国家 | 存储为数据集中的值 |
---|---|
阿富汗 | 1 |
阿尔巴尼亚 | 2 |
阿尔及利亚 | 3 |
[...] | [...] |
津巴布韦 | 195 |
在意大利语版本中,同一变量如下所示:
选择的国家调查中 | 作为值存储在数据集中 |
---|---|
阿富汗 | 2 |
阿尔巴尼亚 | 198 |
阿尔及利亚 | 199 |
[...] | [...] |
津巴布韦 | 391 |
换句话说,国家/值的顺序是相同的,但保存的值在英语 + 意大利语之间不匹配。
我可以手动重新编码每个值(即,在意大利语版本中,将 2 重新编码为 1、198 重新编码为 2、199 重新编码为 3 等),但需要花费大量时间来完成多个调查的 195 个选项。 有什么方法可以自动执行此操作,以便意大利语版本中的最小可能值(在本例中为值 2)被重新编码为 1,最大可能值(在本例中为值 391)被重新编码为 195 ,并且之间的所有内容也会相应地自动重新编码?
(请注意,这是关于重新编码可能值,因为数据集不一定包含每个响应选项的值。)
谢谢!
I am working on processing data from multiple surveys in R. These surveys contain the same questions completed in different languages. For some of the questions, selections that indicate the same response have unfortunately been saved under a different value, and I want to recode these so that they are the same across surveys.
For instance, participants have to select the country that they live in (out of 195 options). In the English version this looks like this:
Country selected in the survey | Stored as value in the dataset |
---|---|
Afghanistan | 1 |
Albania | 2 |
Algeria | 3 |
[…] | [...] |
Zimbabwe | 195 |
In the Italian version, the same variable looks like this:
Country selected in the survey | Stored as value in the dataset |
---|---|
Afghanistan | 2 |
Albania | 198 |
Algeria | 199 |
[…] | [...] |
Zimbabwe | 391 |
In other words, the order of the countries/values is the same, but the saved values don’t match between English + Italian.
I can manually recode each value (i.e., in the Italian version recode 2 as 1, 198 as 2, 199 as 3, etc.) but it takes a lot of time to go through 195 options for multiple surveys.
Is there some way that I can automate this, so that the smallest possible value in the Italian version (in this example, value 2) gets recoded to 1, and the largest possible value (in this example, value 391) gets recoded to 195, and everything in between gets recoded accordingly automatically as well?
(Please note this is about recoding the possible values, as the dataset does not necessarily contain a value from each response option.)
Thank you!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论