顶尖时代全文检索系统软件 Top Search Server

系统概述

为了使全文检索系统在企业信息化建设中发挥整合作用,全文检索系统除了为各种企业数据库中任何格式的资料提供索引(Indexing)、搜索(Searching)和检索(Retrieving)机制外,它还应具备其他更多的功能。全文检索系统若要提升成为企业应用的基础构件,需要参考企业环境的复杂性和异构性来建立全文检索的架构体系。

顶尖时代搜索引擎系统Top Search Server正是以一种组件化、松偶合的设计理念来对架构平台进行设计的,期望协助企业在面对日趋复杂和异构的应用平台时,能将信息检索技术更深入的嵌入企业的应用基础平台上。Top Search Server的设计优势能让软件开发商、系统整合商和最终客户能够将信息检索技术作为一应用基础平台,进而对企业异质资料提供更有价值,更实时性及更具相关性的搜索服务。


1.jpg


图:Top Search Server 平台架构

整个系统从下向上分成4个层次 :

l  信息源层

Top Connector:顶尖时代内部资源同步接口软件产品,主要负责与客户内部多个系统进行数据接口对接,将需要索引的数据和用户信息进行批量同步。在生产过程中进行更新同步。包括数据库内容和文本内容等。

Top Spider:顶尖时代互联网信息采集软件产品,主要是针对互联网的各种资源,例如新闻网站、论坛、微博、视频、图片、收费站点、电子商务站点、国外站点等进行采集与分析,输出到后续搜索引擎中。

l  信息分析与服务层

Top Search Server顶尖时代搜索引擎核心软件产品由一系列内容分析与内容索引核心、搜索相关应用组件组成,将收集和汇整的内容进行断词、索引、分类、文件特征分析等处理,以便满足信息检索与信息管理的应用。

主要包含:

分结构化信息的应用功能:关键词搜索、图片检索、视频检索、信息关联、信息聚类、信息分类、概念搜索、摘要提取、信息去重;

用户信息:用户搜索行为分析、用户权限继承与映射、用户搜索个性化定制;

搜索统计:搜索流量、来源分析、搜索词排名

相关负责功能:搜索置顶、下拉提示、相关词推荐、关键词纠错

l  应用层

基于Top Search Server 可以完成的应用系统:站群搜索、统一搜索、舆情监控、竞争情报、知识搜索、档案搜索、文档搜索、信息采集分类;

基于Top Search Server 可以完成的云服务:云搜索、云采集、搜索统计服务、网站健康检查及统计服务。

五、系统优势

l  产品模块集成度高

Top Search Server平台除了搜索核心软件外,还包含了Top Connector 、 Top Spider 、搜索统计、用户信息、搜索服务功能等模块,各个模块内部集成度高,使得用户部署一个Top Search Server 即可以满足全部搜索相关的服务与应用。

l  组件化整合式平台

采组件化设计,是一个开放式、具有弹性的平台,各组件可即插即用,使开发更具延展型与扩充性。顶尖时代还将将不断推出更多的相关组件及文件提取组件,方便用户使用。

l  支持二次开发接口

系统提供COM和 Java等两种程序整合接口,可轻易结合微软平台及Java平台。针对特殊文件,提供文件提取器组件的SDK,方便使用者进行定制开发或二次开发整合。

l  提供全面的权限整合机制

可使用XML Export与Import机制提供的内容权限管理整合接口。利用XML进行权限整合描述,和其它系统的权限架构做整合。整合后,不同的权限使用者使用时,将得到符合各自权限的信息。

l  索引实时更新机制

针对新增或修改的数据,能够实现实时索引更新功能,真正满足对文件查询实时性与一致性的需求,加快索引更新时间同时减少硬件负担,提高系统效率。

七、成功案例

首都之窗搜索 (www.beijing.gov.cn)

blob.png

卫计委门户搜索(http://www.nhfpc.gov.cn/)

blob.png

海淀门户搜索

blob.png

珠海横琴门户搜索(www.hengqin.gov.cn)

blob.png






















热门推荐