演讲嘉宾

大数据核心技术与应用实战峰会

张 琪

百度高级产品经理、百度开放云大数据平台产品负责人

百度高级产品经理,百度开放云(bce.baidu.com)大数据平台的产品负责人,热爱数据热衷布道,希望打造良心产品以及交流核心技术,帮助中国企业充分发挥其数据的商业价值。

演讲主题

大数据时代的数据仓储

为了监视进度、成本、质量以及指导业务流程改进,企业往往需要建设数据仓库以便产生报表和支持决策,一向是企业应用中的明珠。进入大数据时代以后,人们往往把大数据与Hadoop/Spark等同起来,数据仓库也非要SQL on Hadoop/Spark不可。其实,这个观点有些教条。大数据并不只是MapReduce,Massively Parallel Processing(MPP)也是一种为数据仓库设计的计算模型。MPP与MapReduce有许多类似的地方,比如都是在集群上分布式处理数据然后汇总数据,只是术业有专攻,它们有各自擅长的场景,是个互补的关系。在这个专场中,我们将介绍数据仓储的两种实现技术、各自适合的场景以及优缺点,借助demo,帮助观众灵活运用两种技术在大数据时代获取新的洞察力。