赛思信安公司凭借在海量数据存储、优化、安全与管理等领域的多年研发积累,推出了赛思大数据一体化解决方案,即Scistor® BDMS赛思大数据管理系统。该系统以其精简、智能、高效、开放及本土化设计的五大创新理念,展现了先进的设计思路和独特的技术魅力,攻破了多项国内数据存储和计算领域的关键技术,如:分布式存储、多源异构数据整合、重复数据删除、并行计算等等,受到行业内厂商与专家的高度关注,赛思信安也一跃成为国内在大数据核心技术领域里具有自主创新能力的领先厂商。
下面,我们简单介绍一下Scistor® BDMS 赛思大数据管理系统软件架构的几个层次及主要技术特点。

上图可见,Scistor® BDMS 赛思大数据管理系统架构分为四层。最底层为数据管理平台,负责完成数据存储与计算。其中ddfs采用的是赛思自主创新的高效数据消冗引擎,即赛思消冗技术。赛思消冗技术结合了定长分块技术和变长分块技术的优点,形成了文件感知消冗技术,一方面占用少量系统资源,另一方面达到很好的消冗效果;检索引擎主要负责完成实时查询与全文检索,赛思检索引擎支持多种检索模式,一份数据既支持实时查询,也支持离线分析,还支持全文检索和MR并行计算;分析引擎主要负责数据离线分析;分布式计算引擎采用share-nothing架构,负责系统并行计算,实现并行计算编程模型和运行时框架,从而为数据分析层提供强大的计算能力。
第二层为数据分析层,主要基于数据管理平台提供的数据进行存储与计算,在此基础上完成数据的分析挖掘。第三层为数据展示层,该层主要为用户提供经过检索、分析后数据的在线展示,包括报表、趋势等多形态效果展示。最上层为应用结合层,Scistor® BDMS提供多种二次开发接口,可以针对客户不同业务应用定制不同的模板,形成具有各行业特色的大数据应用整体解决方案,满足各行业用户应用的不同需求。
Scistor® BDMS赛思大数据管理系统与市场上几款主流国外厂商的大数据产品相比,还具有以下特点:
- 较原有Hadoop系统,Scistor® BDMS与Oracle数据库很方便的结合。原有Hadoop支持简单的sql语句查询,基本为K-V查询。BDMS查询语义更为丰富,支持绝大多数标准SQL语句,支持组合查询,支持模糊检索,支持聚合查询等;
- Scistor® BDMS可支持MapReduce分布式计算框架;
- 原有Hadoop系统中不同组件,存放数据格式不一致,而Scistor® BDMS存储格式统一,在一份数据上Scistor® BDMS同时可支持实时查询,离线分析,全文检索及MapReduce计算等;
- 支持的检索模式丰富,除了Hadoop的KV型检索,还支持多维检索、模糊检索、正则表达式检索;
- 原有Hadoop组件Hive支持SQL语义稍微丰富点,但性能极低,Scistor® BDMS支持SQL语义丰富,而且查询性能极高;
- 融合了赛思的消冗技术,对数据存储空间利用率及数据处理效率有比较明显的提高;
- Scistor® BDMS对小文件存储进行了优化,可以支持亿级海量小文件高效的存放与读取。
原标题:赛思Scistor®BDMS助力企业纵横大数据世界
来源:中国教育信息化网
