根据 R 中可能出现的顺序自动重新编码变量值

发布于 2025-01-11 10:13:19 字数 1102 浏览 1 评论 0原文

我正在处理 R 中多项调查的数据。这些调查包含用不同语言完成的相同问题。对于某些问题,表示相同答案的选择已保存在不同的值下,我想对这些问题重新编码,以便它们在调查中保持相同。

例如,参与者必须选择他们居住的国家(从​​ 195 个选项中选择)。在英语版本中,如下所示:

调查中选择的国家存储为数据集中的值
阿富汗1
阿尔巴尼亚2
阿尔及利亚3
[...][...]
津巴布韦195

在意大利语版本中,同一变量如下所示:

选择的国家调查中作为值存储在数据集中
阿富汗2
阿尔巴尼亚198
阿尔及利亚199
[...][...]
津巴布韦391

换句话说,国家/值的顺序是相同的,但保存的值在英语 + 意大利语之间不匹配。

我可以手动重新编码每个值(即,在意大利语版本中,将 2 重新编码为 1、198 重新编码为 2、199 重新编码为 3 等),但需要花费大量时间来完成多个调查的 195 个选项。 有什么方法可以自动执行此操作,以便意大利语版本中的最小可能值(在本例中为值 2)被重新编码为 1,最大可能值(在本例中为值 391)被重新编码为 195 ,并且之间的所有内容也会相应地自动重新编码?

(请注意,这是关于重新编码可能值,因为数据集不一定包含每个响应选项的值。)

谢谢!

I am working on processing data from multiple surveys in R. These surveys contain the same questions completed in different languages. For some of the questions, selections that indicate the same response have unfortunately been saved under a different value, and I want to recode these so that they are the same across surveys.

For instance, participants have to select the country that they live in (out of 195 options). In the English version this looks like this:

Country selected in the surveyStored as value in the dataset
Afghanistan1
Albania2
Algeria3
[…][...]
Zimbabwe195

In the Italian version, the same variable looks like this:

Country selected in the surveyStored as value in the dataset
Afghanistan2
Albania198
Algeria199
[…][...]
Zimbabwe391

In other words, the order of the countries/values is the same, but the saved values don’t match between English + Italian.

I can manually recode each value (i.e., in the Italian version recode 2 as 1, 198 as 2, 199 as 3, etc.) but it takes a lot of time to go through 195 options for multiple surveys.
Is there some way that I can automate this, so that the smallest possible value in the Italian version (in this example, value 2) gets recoded to 1, and the largest possible value (in this example, value 391) gets recoded to 195, and everything in between gets recoded accordingly automatically as well?

(Please note this is about recoding the possible values, as the dataset does not necessarily contain a value from each response option.)

Thank you!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文