我如何开始构建土耳其语词网以用于情感分析

发布于 2024-12-23 03:08:32 字数 260 浏览 2 评论 0原文

虽然我有电子工程背景,但我没有机会参加自然语言处理课程。

我想为土耳其语构建情感分析工具。我认为最好创建一个土耳其语 wordnet 数据库,而不是将文本翻译成英语并使用提供的工具使用有缺陷的翻译文本进行分析。 (是吗?

那么你们建议我做什么?首先是从公开课网站上学习NLP课程吗?我真的不知道从哪里开始。您能帮助我并为我提供一步一步的指导吗?我知道这是一个学术项目,但我有兴趣将培养该领域的技能作为一种爱好。

提前致谢。

Although I hold EE background, I didn't get chance to attend Natural Language processing classes.

I would like to build sentiment analysis tool for Turkish language. I think it is best to create a Turkish wordnet database rather than translating the text to English and analyze it with buggy translated text with provided tools. (is it?)

So what do you guys recommend me to do ? First of all taking NLP classes from an open class website? I really don't know where to start. Could you help me and maybe provide me step by step guide? I know this is an academic project but I am interested to build skills as a hobby in that area.

Thanks in advance.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

演多会厌 2024-12-30 03:08:32

这是我之前使用过的过程(制作日语、中文、德语和阿拉伯语语义网络):

  1. 收集至少两个英语/土耳其语词典。它们必须是独立的,而不是相互衍生的。您可以使用维基百科自动生成一本词典。如果您需要发布您的网络,那么您可能需要开源词典,或许可费,或律师。
  2. 使用这些词典翻译英语 Wordnet,为每个同义词集生成置信度评级。
  3. 保留那些有很强信心的人,通过那些中等或低信心的人手动批准或修复。
  4. 手动完成

我在 2008 年论文的“WordNet 自动翻译”部分对此进行了扩展:http://dcook.org/mlsn/about/papers/nlp2008.MLSN_A_Multilingual_Semantic_Network.pdf

(对于您所说的土耳其语情感词典目标,还有其他方法,不涉及语义网络例如,Bing Liu 的“语义分析和意见挖掘”是一个很好的研究综述,但恕我直言,从长远来看,语义网络方法总是会给出更好的结果。运行,并且有很多其他用途。)

Here is the process I have used before (making Japanese, Chinese, German and Arabic semantic networks):

  1. Gather at least two English/Turkish dictionaries. They must be independent, not derived from each other. You can use Wikipedia to auto-generate one of your dictionaries. If you need to publish your network, then you may need open source dictionaries, or license fees, or a lawyer.
  2. Use those dictionaries to translate English Wordnet, producing a confidence rating for each synset.
  3. Keep those with strong confidence, manually approving or fixing through those with medium or low confidence.
  4. Finish it off manually

I expanded on this in the "Automatic Translation Of WordNet" section of my 2008 paper: http://dcook.org/mlsn/about/papers/nlp2008.MLSN_A_Multilingual_Semantic_Network.pdf

(For your stated goal of a Turkish sentiment dictionary, there are other approaches, not involving a semantic network. E.g. "Semantic Analysis and Opinion Mining", by Bing Liu, is a good round-up of research. But a semantic network approach will, IMHO, always give better results in the long run, and has so many other uses.)

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文