网络信息采集系统(KSpider)

一、产品简介

KSpider网络信息资源采集系统是一个集网络数据采集、分析、存储、管理及检索等功能于一体的网络信息资源整合系统。

二、服务对象

大专院校、科研机构、企事业单位。

三、产品功能

1、先进的智能代理

准确筛选用户感兴趣的信息并自动分类,支持用户自定义分类体系,为用户提供了多种方式定制感兴趣的主题。

2、强大的信息采集能力

高效的信息采集技术完成网络数据获取,能快速、全面、准确的从Internet上获取数据。

3、体系结构灵活

采集蜘蛛群集,智能代理群集,应用服务器智能调度,各子系统可以随时断开随时连接到系统中来,不影响整个系统的运行。

4、基于KBase的海量数据存储和全文检索

支持海量非结构化数据的存储管理,拥有成熟的全文检索技术,检索速度达500G/S,处于业界领先水平。

5、优秀的发布系统

支持动态摘要和敏感摘要,并标红,Google风格检索,提供网页快照,网页自动关联。

6、稳定可靠的系统性能

采用分布式的群集系统、高效的搜索算法以及灵活的体系结构,保证整个系统的稳定、易用。

7、满足用户的各种个性化检索需求

支持用户自定义符合自己行业、企业特殊需求的个性化分词词典。

8、支持主流的中文编码标准

包括GBK(汉字内码扩展规范)、GB2312(简体)、BIG5(繁体),UTF-8,并且能够在不同的编码之间转换。