Product Center
神通T-Search文本检索系统
神通T-Search文本检索系统(简称“神通T-Search”)是天津神舟通用数据技术有限公司(简称“神舟通用公司”)研发的分布式全文检索系统,实现对WPS、WORD、PPT、EXCEL、PDF、HTML、TXT、XML、CSV等常见文档内容数据的管理,并按照指定关键字进行全文检索。系统提供了智能提示、全文检索、关键词及逻辑表达式检索、组合排序、分组统计、自动摘要、主题词典创建、相似推荐、自动关联等核心检索功能。系统主要特点包括:
· 采用分布式检索引擎,支持集群部署和弹性扩展节点,支持TB级文本检索
· 支持Windows、Linux、Unix、国产等平台的32/64位操作系统
· 检索库支持多副本机制,提供高可靠性保障
· 基于BS架构的图形化管理界面,提供良好的人机交互和使用体验
· 支持多种文本格式解析和导入(支持WPS、WORD、PPT、EXCEL、PDF、HTML、TXT、XML、CSV等)
· SQL语法支持,用户使用SQL语句对文本检索库进行灵活的查询和统计
· 支持自定义文本检索主题,方便用户快速构建检索场景
· 提供完善的权限管理机制,实现接口访问权限、数据权限等细粒度权限控制,提供企业级安全特性
· 图形化的集群监控功能,方便运维管理人员实时监测系统运行状态
· 丰富的第三方调用接口,支持Java、C#、PHP等多种开发语言调用,提供标准JDBC和WebService开发接口· 支持UTF-8、GBK、GB18030、BIG5等多种中英文字符集
![]()
图1 神通T-Search核心功能
神通T-Search基于多层架构设计,核心检索层采用了基于分布式架构的文本检索引擎,支持集群部署和动态扩展结点。服务层提供了丰富的外部调用接口(WebService、JDBC接口)和权限管理机制,支持第三方系统调用和整合。应用层提供图形化的文本数据导入、检索和管理等功能,支持多用户访问。
![]()
图2 T-Search系统架构