需要了解文本挖掘以从大量文件中挖掘数据

发布于 2024-12-22 14:02:43 字数 224 浏览 1 评论 0原文

我是数据挖掘的新手。我正在攻读学士学位的最后一年,我最后一年的项目标题是“使用文本挖掘从学生反馈中提取和分析管理学科的教师表现”。在这里,我们将有许多包含学生给出的反馈的文件,每个学生都会有一个文件。我们必须从所有这些文件中检索有用的信息。

任何人都可以建议我如何开始,要使用哪些工具? 将使用哪些技术? 我熟悉JAVA(jse),我可以使用java编程语言实现这一点吗?如何?

问候... 乌彭德拉

I am new for data mining. I am doing my B.Tech final year, my final year project title is "Extraction and analysis of faculty performance of management discipline from student feedback using text mining". Here we will have number of files which contains feedback given by students, each student will have one single file. From all these files we have to retrieve useful information.

can any one suggest me how to start, what are the tools to be used?
what are the technologies to be used?
I am familiar with JAVA(jse), can i achieve this using java programming language, how?

regards...
Upendra.S

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

静若繁花 2024-12-29 14:02:43

一些想法:

  • 哪些是最常用的单词或短语?
  • 哪些单词经常同时出现(关联分析)
  • 按学生成绩划分的单词/短语频率(排名靠前和垫底的学生在教授评论中使用哪些单词?)
  • 按教师评分划分的单词/短语频率(哪些单词与学生的分数相关)给教职人员?)
  • 按教职任期划分的单词/短语频率(哪些词与新教授和老教授相关?)

这是我关于使用 Rapidminer 进行文本挖掘的五部分系列:

http://vancouverdata.blogspot.com/2010/11/text -analytics-with-rapidminer-loading.html

Some ideas:

  • which are the most frequently used words or phrases?
  • which words often co-occur (association analysis)
  • word/phrase frequency by student grade (which words do the top and bottom students use in their prof reviews?)
  • word/phrase frequency by faculty rating (which words are associated with the score that students give the faculty member?)
  • word/phrase frequency by faculty tenure (which words are associated with new and older profs?)

here is my five part series on text mining with rapidminer:

http://vancouverdata.blogspot.com/2010/11/text-analytics-with-rapidminer-loading.html

习ぎ惯性依靠 2024-12-29 14:02:43

我相信 Rapidminer 有一个文本挖掘扩展。然后是JTMT。

还可以使用此处的搜索功能:

另请参阅教育数据挖掘社区。他们可能有类似的任务。

I believe Rapidminer has a text mining extension. Then there is JTMT.

Also use the search function here:

Also have a look at the Educational data mining community. They probably have similar tasks.

吻安 2024-12-29 14:02:43

我认为,您可以浏览这些主题。它对我的一个项目有帮助。

工具 - Matlab TMG 工具

使用的算法 - 潜在语义分析。 (LSA 示例)

数学概念 - 奇异值分解。 (SVD

In my opinion , you can go through these topics. It helped in one of my projects.

Tool - Matlab TMG tool .

Algorithm Used - Latent Semantic Analysis . (LSA Example)

Mathematical Concept - Singular Value Decomposition . (SVD)

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文