起点R3: 国内首个开源企业搜索引擎

一直以来,搜索引擎似乎就是百度和谷歌的代名词,殊不知这两个强大的互联网搜索工具也只能提供网络全部信息的2%,而且这些信息只是面广精确度低,真正实用的寥寥无几,还有98%的信息被隐藏在防火墙内的企业环境中。

而这剩余的98%的信息恰恰是含金量最高也是企业最需要的,特别是在国外,大量的企业通过更为先进的搜索平台企业搜索引擎帮助自己提取了更多的有效信息,并实现了企业效益的快速增长,而国内相关搜索还是一片空白。值此重大机遇,佛山起点软件公司成功开发了国内第一个开源企业搜索引擎起点R3,以更精准的搜索,更快速的数据获取处理,更安全的权限系统用心为企业服务,同时系统源代码没费开放,开启了中国企业搜索新格局。

一、专注企业搜索服务 敢为国人先

佛山起点软件服务有限公司自成立之日起,就明确的将自己定位为中国领先的企业搜索服务提供商。为此,吸纳了大批技术骨干和对相关资讯进行了搜集整理,其核心产品起点R3研发团队更是在长期的软件开发中积累了丰富的经验和雄厚的技术,但仍然反复考察和研究国外同行,借机提炼其精华与先进经验,并将之融入到R3软件上来。

为此,立足于Solr和Lucene之上,高性能的JAVA企业级搜索引擎产品R3软件,通过集成POI、PDFBox和Apache Tika等优秀的第三方开源项目,让所有实效信息在搜索平台上集中展示,只需点击鼠标,企业用户便可安全、快速、准确的搜索到所有相关的内容,包括网站、邮箱、ECM, CRM等,并进一步增强了企业环境中数据获取能力,实现了跨操作系统的获取Domino中的数据、支持超过20种数据库系统和超过10种内容仓库的数据。强大的获取能力保证了R3在企业搜索功能中的优势,采集的内容中如果是文件,可以通过预览的方式快速查看文档的文本内容,并通过下载的方式获取到原文件内容,并且是经过安全验证的。

起点软件两年来只做一件事,那就是如何更好的为企业提供更为强大的搜索引擎。为此,在开源的基础上充分考虑了用户的需求和体验,不断调整和创新了一些功能,近期新推出的5.1版本就包含了全中文web界面搜索、海量信息瞬间获取处理、更高级别安全权限、自由定制、自由扩展,可视化采集企业数据,支持大部分文档格式并可通过插件扩展等用户急需功能,一经推出就备受赞誉,并与铁道部、中建等行业巨头达成深度合作关系。其研发速度和成型时间较之国内同行遥遥领先。

二、有效信息精准搜索 只在咫尺之间

企业搜索引擎一个十分重要的特点就是其搜索的高精准度,也就是说将用户最需要的信息列在最前面;另一方面则是其能够保证检索结果中的所有信息都是经过访问授权的,特别是在处理企业中的敏感信息,需要在瞬息之间完成权限验证。

为了保证R3搜索出来的信息更为准确,起点R3通过改进关键运算算法,将其他信息忽略,只将我们最需要的信息列在第一页。对各种重要性的影响因子合理计算权重,综合考虑各种因素的影响,包括词频、命中覆盖率、标题的重要性、词与词的语义关系、词与词之间的语义距离和顺序等等因素,得到一个合理的相关度值,实现用户对于“准确”的检索要求,用户甚至不必查看文档具体内容,就能了解其主要内容。从而在速度的基础之上保证了其高准确率。

三、自定义访问控制 高级别安全性能

大量案例表明,如果企业环境中的数据无法保证其安全性,宁可不搜索。而R3自研发开始就高度重视安全这一要素,特别是用户系统和权限系统。而这款软件通过收集和整理用户意见,积极修复和提升安全级别,整合了企业环境中各种复杂用户系统和权限系统,并将其完整的集成起来,并将用户数据和权限数据应用在检索结果上,这个能力将全面保证用户检索的数据是经过授权的,能够合法查看的数据。包括文件服务器中的文档,FTP、Domino、内容系统、OA、ERP、CRM等等各种系统。未经授权的用户绝对不能访问关键数据和业务。

同时集成domino,ldap、windows域和第三方的crm、oa、erp等用户,集成各种类型的用户系统和,继承原有的文档访问权限,过创独有的插件系统创新的采用了主动触发式和被动式的授权机制来保证用户检索的数据是经过授权的,无缝的集成已有的权限系统和用户系统,几乎不用对已有系统做任何调整和修改,同时对数据访问严格控制,避免非受权用户访问,同时也设置了更高级别的自定义安全企业数据安全访问控制,做到真正的高级别安全控制。

佛山起点软件公司以强大的研发团队,深厚的技术积累,高效的搜索功能开发了中国第一个开源企业搜索引擎起点R3软件,历时两年,厚积薄发于近日公布了其最新的5.1新产品,支持实时搜索,精准深挖网络资讯,高速处理海量数据并具有更高级别的安全性能,这也是中国第一个与国外的Google Mini ,微软的 FAST,IBM的Omnifind同台竞技的对手,高效满足国内企业需求的同时也是弥补了一项重大空白。

作为国产开源企业搜索引擎的领军企业,佛山起点软件正以高规格的实际姿态为用户服务,无异于行业内的一支旗帜,我们完全有理由为之祝福,为之期待!

:起点R3企业级搜索引擎是起点软件提供的企业搜索解决方案,支持企业环境下的数据访问控制(ACL),能够通过定义用户数据访问权限来控制检索数据的安全。

R3是一个强大的,高性能的JAVA企业级搜索引擎产品,R3构建于Solr和Lucene之上,集成了POI、PDFBox和Apache Tika等第三方开源项目,在R3企业级搜索平台上,你可以搜索出你企业所有相关的内容包括网站、邮箱、ECM, CRM。R3使用一中新的集群模式来实现分布式和集群功能,通过扩展计算能力,R3能够支持上千G文档,完成复杂的并行运算;R3能够以集群模式运行来提高系统的可用性。它支持超过15种语言的多语言搜索,能够集成文档自动分类和聚类功能,能够为文档自动、智能的添加标签和关键字。可以通过采集器为索引库定制数据来源,采集器通过插件的方式扩展。默认提供数据库、邮件、本地文件系统、网络文件系统、FTP、Domino、CSV、Access的采集器。R3基于Solr之上,所以在Solr中的层面搜索、同义词等都被完整的保留了下来。R3通过作业调度系统实现了任务的自动化采集、能够增量索引,支持数据更新,能够通过可视化的方式对索引字段进行管理。R3具备用户和用户组管理,R3可以对数据类型定制,支持分词器、过滤器、缓存管理。R3能够很容易的集成Hadoop和HBase。此外它还开发多种编程语言的API包括:Ruby、PHP、Java、Python、JSon、C#、ColdFusion。R3具有以下特性:

  1. 索引快-索引10G文档只要0.5个小时。
  2. 能够可视化的采集企业中的大部分数据
  3. 采集能力能够扩展到企业的全部数据
  4. 支持绝大部分文档格式,并能够通过插件扩展
  5. 支持高达255T的海量数据,并支持分布式存储和分布式运算
  6. 支持自定义任务计划和采集效率
  7. 支持自定义的企业数据安全访问控制(ACL)
  8. 强大集成能力,可以支持企业系统中的各种用户系统和权限系统
  9. 强大快速的搜索功能,支持关键词搜索、时间搜索、范围搜索,支持主题分类和概念检索
  10. 超过10T的数据,大部分检索时间在0.5秒以内
  11. 完全中文的企业级搜索系统
  12. 在同一个系统中,不用角色的用户可以访问不同的检索界面
  13. 自由定制、自由扩展
起点R3管理后台
起点R3搜索界面

您可以通过http://demo.rivues.com:93 访问起点R3的Demo
您可以通过http://demo.rivues.com:195 访问起点R3的电子商务搜索Demo
您可以通过http://www.rivues.com访问起点R3其他信息
您可以通过SourceForge http://sourceforge.net/projects/rivues/ 下载产品和源码

“起点R3: 国内首个开源企业搜索引擎”的15个回复

发表评论

电子邮件地址不会被公开。 必填项已用*标注