在这里,必须要提一下内存计算。我引用1998年一位图灵奖获得者的一句话,Tape is Dead, Disk is Tape, Main memory is Disk, CPU Cache is Main Memory。Sybase在3、4年前就已经不再推荐使用磁带来做Sybase IQ的备份了。
其次就是存储。举个例子,CPU里面有Level 1 Cache(一级缓存),它访问的速度只有1纳秒,就好像坐在家里沙发的我想喝一杯茶,最好这杯茶是在我沙发边上的茶几上,我一伸手就可以拿到。Level 2 Cache(二级缓存),访问速度为5纳秒,可以想象我是到了另外一个房间里面去拿这杯茶。Level 3 Cache(三级缓存)20纳秒,我是出了房间到隔壁的房子里去拿这杯茶,Main Memory是100个纳秒,好像是我要过马路,到另外一个房子里面去拿。而Disk就好像是从北京到上海,从上海到广州这样一个遥远的距离。
所以,大家要认识到存储永远是数据库的一个非常重要的载体,同时存储也是数据库性能的一个最大的瓶颈,如何能够提高存储的效率,如果解决了这个问题,就解决了数据库以及数据分析的效率问题。
另外,我还必须提到SAP的HANA。HANA是业界第一个完全基于内存的、高性能的分析服务器,专门用于分析的一体机,其内存计算对分析领域有着里程碑式的贡献。HANA把所有的分析都放在内存里面进行,整个架构非常地优越,可以有列式数据库,也有行式数据库,有内置的数据复制软件,也有各种各样的建模软件,是新一代的分析服务器。在HANA的架构下,我们可以对一个企业下面70几个分公司,几千亿条记录,50个TB的数据进行分析,而它的分析速度仅为零点零几秒,这个是以前不敢想象、也不敢去围绕这样的情境去提应用需求的划时代产品。
综上所述,SAP公司在硬盘级、内存级甚至加上CPU的缓存级,为业界提供了非常优秀的分析平台,在分析云、大数据的分析领域是一个非常重要的提供商。
|