需要了解文本挖掘以从大量文件中挖掘数据
我是数据挖掘的新手。我正在攻读学士学位的最后一年,我最后一年的项目标题是“使用文本挖掘从学生反馈中提取和分析管理学科的教师表现”。在这里,我们将有许多包含学生给出的反馈的文件,每个学生都会有一个文件。我们必须从所有这些文件中检索有用的信息。
任何人都可以建议我如何开始,要使用哪些工具? 将使用哪些技术? 我熟悉JAVA(jse),我可以使用java编程语言实现这一点吗?如何?
问候... 乌彭德拉
I am new for data mining. I am doing my B.Tech final year, my final year project title is "Extraction and analysis of faculty performance of management discipline from student feedback using text mining". Here we will have number of files which contains feedback given by students, each student will have one single file. From all these files we have to retrieve useful information.
can any one suggest me how to start, what are the tools to be used?
what are the technologies to be used?
I am familiar with JAVA(jse), can i achieve this using java programming language, how?
regards...
Upendra.S
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
一些想法:
这是我关于使用 Rapidminer 进行文本挖掘的五部分系列:
http://vancouverdata.blogspot.com/2010/11/text -analytics-with-rapidminer-loading.html
Some ideas:
here is my five part series on text mining with rapidminer:
http://vancouverdata.blogspot.com/2010/11/text-analytics-with-rapidminer-loading.html
我相信 Rapidminer 有一个文本挖掘扩展。然后是JTMT。
还可以使用此处的搜索功能:
另请参阅教育数据挖掘社区。他们可能有类似的任务。
I believe Rapidminer has a text mining extension. Then there is JTMT.
Also use the search function here:
Also have a look at the Educational data mining community. They probably have similar tasks.
我认为,您可以浏览这些主题。它对我的一个项目有帮助。
工具 - Matlab TMG 工具 。
使用的算法 - 潜在语义分析。 (LSA 示例)
数学概念 - 奇异值分解。 (SVD)
In my opinion , you can go through these topics. It helped in one of my projects.
Tool - Matlab TMG tool .
Algorithm Used - Latent Semantic Analysis . (LSA Example)
Mathematical Concept - Singular Value Decomposition . (SVD)