从100万行log记录中筛选有价值的信息
问题:从100万行log记录中筛选有价值的信息,需要用到什么知识?是大数据么?具体是大数据的哪部分知识?把他们筛选出来,用什么工具?对它们分析,用什么工具?想自学这方面的东西,希望懂的人给个指点。多谢~~
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
问题:从100万行log记录中筛选有价值的信息,需要用到什么知识?是大数据么?具体是大数据的哪部分知识?把他们筛选出来,用什么工具?对它们分析,用什么工具?想自学这方面的东西,希望懂的人给个指点。多谢~~
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(3)
100万行正常的日志,真的不大,grep即可
你可以试试HOOLI 是一款专门用于实时log数据分析的工具,支持日志数据收集 分析 索引 可视化等功能
登陆 www.hoolix.com 申请试用
我在这儿说一下,大数据不仅仅是数据量大,况且你的数据量也不大。无论是互联网时代还是大数据时代,技术永远是工具,去更好帮助人们解决生活社会问题的工具。就目前而言面对大量的数据,我认为我们可以做两件事,一,目标明确的查询检索,那可能会用到hadoop或者spark这些分布式运算引擎帮你快速计算出你要的结果;二,挖掘潜在价值,也就是你说的”筛选有价值的信息“,这可能需要机器学习算法,那么你得根据业务建模,然后把多维度,大量的数据导入训练。简单如上,如果像进一步学习可以相互交流。