当前位置：文江博客话题详情

如何从姓氏猜出一个人的国籍？

发布于 2024-12-06 21:37:26 字数 291 浏览 4 评论 0原文

我可以使用什么方法从姓氏来预测一个人的国籍？

我有大量作者的文本和姓氏列表。我想确定哪些文本是由拉丁语使用者撰写的，哪些文本是由英语母语人士撰写的，以便研究一组中的某些写作风格模式是否与另一组不同。

我在 google 和 pubmed 中查找过姓氏数据库，但找不到任何可以免费访问的数据库。另一种方法是使用一些正则表达式，例如“.*ez”来识别一些西班牙裔姓氏，例如“rodriguez”，但这并没有让我走得太远。

您有什么建议吗？由于我会在做出预测后手动修改所有关联，因此我不需要很高的准确性，但欢迎任何帮助或想法。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

乞讨 2024-12-13 21:37:26

我不认为你能以任何程度的可靠性做到这一点。罗德里格斯很可能有一个西班牙血统的名字，但很可能在任何地方出生和长大。他们可能是第二代英国人，周围从来没有人说过西班牙语，因此属于以英语为母语的人。

回复收藏 0 原文

指尖上得阳光 2024-12-13 21:37:26

如果是实际作者，那么也许您可以爬取亚马逊并检查他们的“作者信息”详细信息？

我想你猜不到。例如，爱尔兰姓氏——估计有 80,000,000 人具有爱尔兰血统，但其中 450 万人生活在爱尔兰/接受过爱尔兰教育。

回复收藏 0 原文

完美的未来在梦里 2024-12-13 21:37:26

没有任何有意义的方法可以做到这一点。没有理由说具有西班牙名字的人不能以英语为母语。

如果您无论如何都要修改它，为什么不使用您拥有的数据呢？

回复收藏 0 原文

陌伤浅笑 2024-12-13 21:37:26

假设您打算对文本进行编程比较，则必须手动对文本进行分类。不正确的猜测可能会导致您构建一个损坏的文本分析算法。这对于机器学习（例如人工神经网络）来说尤其成问题。

回复收藏 0 原文

~没有更多了~

关于作者

王权女流氓

暂无简介

文章

26 人气

关注发私信

燃烧我的卡路李先生

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

∞梦里开花

文章 0 评论 0

关注

qq_IklFPL

文章 0 评论 0

关注

迷途知返

文章 0 评论 0

关注

深海不蓝

文章 0 评论 0

友情链接

文江博客

如何从姓氏猜出一个人的国籍？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签