这是“语料库”的正确定义吗?

发布于 2024-11-24 03:17:07 字数 1459 浏览 10 评论 0原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

暗藏城府 2024-12-01 03:17:08

在语言学中,语料库是指正在研究的现实生活 (*) 文本或语音的任何连贯体。所以是的,一本书就是一个语料库。只要您不随机打乱字符,它在一个字符串中这一事实并不重要。

(*) 与心理语言学中常见的做法相反,显示一堆编造的短语来测试受试者以测量他们的反应。

A corpus, in linguistics, is any coherent body of real-life(*) text or speech being studied. So yes, a book is a corpus. The fact that it's in one string doesn't matter, as long as you don't randomly shuffle the characters.

(*) As opposed to a bunch of made up phrases being shown to test subjects to measure their responses, as is commonly done in psycholinguistics.

美人骨 2024-12-01 03:17:08

是的。
http://en.wikipedia.org/wiki/Text_corpus
具体来说,因为它用于统计。

Yes.
http://en.wikipedia.org/wiki/Text_corpus
Specifically, because it's uses for statistics.

西瑶 2024-12-01 03:17:08

通常“语料库”用于指结构化集合,但语言学家会知道你在说什么。

Usually "corpus" is used to refer to a structured collection, but linguists would know what you're talking about.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文