快速检索文档吗?
有很多企业用Domino做OA,其搜索功能多数满足不了要求
流程中的检索功能有时候也不是很强,比如CRM里搜索合同附件和会纪要的附件,自有的搜索功能基本上不大现实。
大中型企业里,像中国移动、中石化、国家电网这样的,有PB级别的文档在各种各样的系统里,可能有20%不到的文档在ECM里,如果没有企业搜索,找资料就只能到各个系统里去找了,甚至于也无法检索附件,多媒体文档就更不用说了。企业搜索将知识型员工每天寻找资料的平均时间从每天3.5小时降低到1.5小时,这就是价值。
企业里面最重要的是组织和流程
任何的搜索或者其他操作行为都是在组织的定义下的
你这个是扁平搜索,和企业搜索关系不大
现在的企业应用里面(CRM,SAP,PDM,ECM,DCM)都带了搜索功能,并且只有用户在组织里面对数据有可见性的时候,这个结果才会暴露出来.
这个意味着,不同的人,用同样的搜索,结果是和他在企业里面的位置相关的,可以说,搜索结果是不一样的。
并且搜索的索引都是非常方便定义的
信息不是暴露给所有用户的,这是企业里面的最基本的
全文检索的功能是 快速、准确的找到信息
企业搜索的功能是 安全、快速、准确的找到信息
企业搜索通过分类、聚类、关键词推荐、搜索导航、Topic Map、概念检索、主题推荐、主题分类、关联分析等很多种技术手段来发掘数据的价值。
各家都有不同的解决方案,比如IBM的子文档级的权限控制,Oracle的权限http://wenku.baidu.com/view/dc4aea8102d276a200292e7c.html,R3的权限是和原系统的用户系统和权限信息集成得到的,完全继承。ECM确实可以管理企业中的各类非结构化信息,也带有搜索功能,但ECM过于庞大,实施的难度也很大,反倒不如企业搜索灵活,现在适合国内企业的真正意义上的ECM产品相当的难找,开源的几个现在国内推广难度也很大,主要也不太适合,EMC的Documentum、IBM等产品的价格也实在是高,我接触到的中国电信、中国移动这样的企业有应用,ECM系统在国内被接受还尚需时日,而企业搜索,已经经历了5年以上的概念推广,和BI一样,也渐入人心,企业搜索在国内有大量的成功案例可以借鉴,这些都是ECM短期内无法相比的
当时计划的产品功能结构的构想图
推荐 http://www.oschina.net/bbs/doc/354,这个调查报告时我在09年的时候做的,日期应该是09年1月份,然后基于这篇调查报告,后来规划开发的起点R3企业搜索产品
企业级搜索与BI系统二者其实都是企业级数据管理深层次应用,它们之间的不同点在于管理数据源的区别。BI主要管理的企业数据源都是数据库形式等结构化数据,企业级搜索的管理数据源是文档、网页、邮件、图片、音视频等非结构化数据。调查显示,企业内部数据在以每年200%的速度增长,而这些数据中,除了20%的数据是以数据库的形式存储外,其他的80%均是网页、各种格式的文件、邮件和图片等非结构化的形式,它们散落在企业内计算机系统中的各个角落。因此,今后的企业级搜索领域将会迎来高速增长期。石建强认为,从功能上来看,企业级搜索与BI系统二者可以看做是互补关系,二者结合可实现对企业数据更优化的管理。
一.现今企业究竟运用了多少结构化数据?结构化数据是指一些传统关系数据库管理系统处理的数据信息。这些信息数据是企业的核心资源,也是企业的价值所在。而企业在正常操作中,其非结构化数据(用纸质记载,电子记录,图片报告音频等形式的企业信息数据),往往在数据量上远大于结构化数据(相关研究表明在总数据中,非结构化占百分之 八十以上)。这些数据记载着企业发展的历程是企业发展提升的重要数据信息。如何最大程度的有效利用这些庞大的数据,如何最大程度的降低处理成本,如何运用其有效数据来进行决策,这些往往是决定企业整体竞争力的关键。二.企业能够管理和得到信息的范围究竟有多大?运用庞大的互联网,谷歌化的关键词搜索模式以及数千万的网页,越来越多元化的互联网信息,整合到的有利信息往往会损耗大量人力以及成本。面对越来越多的信息堆集,企业所投入的管理成本往往愈负愈重。因而部署一套专门服务于企业内部信息的谷歌式搜索引擎,是众多企业的梦想。三.起点ESP-R3的价值在于从企业内部海量数据信息中挖掘知识并转化为企业资产。。企业级搜索的价值在于使得企业的信息处理复杂所致的例如成本的增加,信息的难以维护转变为重新整合后快速高效有机的知识平台,使企业的部门拥有统一的检索接口,最大程度的整合资源价值。在起点ESP-R3的结构当中,其统一检索(经过多不同数据源的整合和消重呈献给企业用户多重个性化数据表达),灵活存储(对所有数据整合成精密分类,利用创新回溯技术对文档进行灵活升级以及安全存储接口),全文检索(概念检索、基于统计的中文语言处理、主题抽取算法, 优异的性能、T级数据支撑能力、亚秒级响应速度,7*24全年稳定运行),深入采集(处对主流数据库的采集之外,对内容仓库的采集)Domino、Documentum等企业内容管理中的数据,对内置文件,以及精准目录的采集和配置数据对统一应用的采集处理)等功能完整的企业检索产品作为对企业实际需求的应用拓展。
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
暂无简介
文章 0 评论 0
接受
发布评论
评论(9)
有很多企业用Domino做OA,其搜索功能多数满足不了要求
流程中的检索功能有时候也不是很强,比如CRM里搜索合同附件和会纪要的附件,自有的搜索功能基本上不大现实。
大中型企业里,像中国移动、中石化、国家电网这样的,有PB级别的文档在各种各样的系统里,可能有20%不到的文档在ECM里,如果没有企业搜索,找资料就只能到各个系统里去找了,甚至于也无法检索附件,多媒体文档就更不用说了。企业搜索将知识型员工每天寻找资料的平均时间从每天3.5小时降低到1.5小时,这就是价值。
企业里面最重要的是组织和流程
任何的搜索或者其他操作行为都是在组织的定义下的
你这个是扁平搜索,和企业搜索关系不大
现在的企业应用里面(CRM,SAP,PDM,ECM,DCM)都带了搜索功能,并且只有用户在组织里面对数据有可见性的时候,这个结果才会暴露出来.
这个意味着,不同的人,用同样的搜索,结果是和他在企业里面的位置相关的,可以说,搜索结果是不一样的。
并且搜索的索引都是非常方便定义的
信息不是暴露给所有用户的,这是企业里面的最基本的
全文检索的功能是 快速、准确的找到信息
企业搜索的功能是 安全、快速、准确的找到信息
企业搜索通过分类、聚类、关键词推荐、搜索导航、Topic Map、概念检索、主题推荐、主题分类、关联分析等很多种技术手段来发掘数据的价值。
各家都有不同的解决方案,比如IBM的子文档级的权限控制,Oracle的权限http://wenku.baidu.com/view/dc4aea8102d276a200292e7c.html,R3的权限是和原系统的用户系统和权限信息集成得到的,完全继承。ECM确实可以管理企业中的各类非结构化信息,也带有搜索功能,但ECM过于庞大,实施的难度也很大,反倒不如企业搜索灵活,现在适合国内企业的真正意义上的ECM产品相当的难找,开源的几个现在国内推广难度也很大,主要也不太适合,EMC的Documentum、IBM等产品的价格也实在是高,我接触到的中国电信、中国移动这样的企业有应用,ECM系统在国内被接受还尚需时日,而企业搜索,已经经历了5年以上的概念推广,和BI一样,也渐入人心,企业搜索在国内有大量的成功案例可以借鉴,这些都是ECM短期内无法相比的
当时计划的产品功能结构的构想图
推荐 http://www.oschina.net/bbs/doc/354,这个调查报告时我在09年的时候做的,日期应该是09年1月份,然后基于这篇调查报告,后来规划开发的起点R3企业搜索产品
企业级搜索与BI系统二者其实都是企业级数据管理深层次应用,它们之间的不同点在于管理数据源的区别。BI主要管理的企业数据源都是数据库形式等结构化数据,企业级搜索的管理数据源是文档、网页、邮件、图片、音视频等非结构化数据。调查显示,企业内部数据在以每年200%的速度增长,而这些数据中,除了20%的数据是以数据库的形式存储外,其他的80%均是网页、各种格式的文件、邮件和图片等非结构化的形式,它们散落在企业内计算机系统中的各个角落。因此,今后的企业级搜索领域将会迎来高速增长期。石建强认为,从功能上来看,企业级搜索与BI系统二者可以看做是互补关系,二者结合可实现对企业数据更优化的管理。
一.现今企业究竟运用了多少结构化数据?结构化数据是指一些传统关系数据库管理系统处理的数据信息。这些信息数据是企业的核心资源,也是企业的价值所在。而企业在正常操作中,其非结构化数据(用纸质记载,电子记录,图片报告音频等形式的企业信息数据),往往在数据量上远大于结构化数据(相关研究表明在总数据中,非结构化占百分之 八十以上)。这些数据记载着企业发展的历程是企业发展提升的重要数据信息。如何最大程度的有效利用这些庞大的数据,如何最大程度的降低处理成本,如何运用其有效数据来进行决策,这些往往是决定企业整体竞争力的关键。
二.企业能够管理和得到信息的范围究竟有多大?运用庞大的互联网,谷歌化的关键词搜索模式以及数千万的网页,越来越多元化的互联网信息,整合到的有利信息往往会损耗大量人力以及成本。面对越来越多的信息堆集,企业所投入的管理成本往往愈负愈重。因而部署一套专门服务于企业内部信息的谷歌式搜索引擎,是众多企业的梦想。三.起点ESP-R3的价值在于从企业内部海量数据信息中挖掘知识并转化为企业资产。。企业级搜索的价值在于使得企业的信息处理复杂所致的例如成本的增加,信息的难以维护转变为重新整合后快速高效有机的知识平台,使企业的部门拥有统一的检索接口,最大程度的整合资源价值。在起点ESP-R3的结构当中,其统一检索(经过多不同数据源的整合和消重呈献给企业用户多重个性化数据表达),灵活存储(对所有数据整合成精密分类,利用创新回溯技术对文档进行灵活升级以及安全存储接口),全文检索(概念检索、基于统计的中文语言处理、主题抽取算法, 优异的性能、T级数据支撑能力、亚秒级响应速度,7*24全年稳定运行),深入采集(处对主流数据库的采集之外,对内容仓库的采集)Domino、Documentum等企业内容管理中的数据,对内置文件,以及精准目录的采集和配置数据对统一应用的采集处理)等功能完整的企业检索产品作为对企业实际需求的应用拓展。