阿里集团技术保障部云计算运维高级技术专家
柯旻,阿里集团技术保障部云计算运维高级技术专家,花名大舞。2007 年加入阿里,目前负责阿里大数据平台(Hadoop
(云梯)/ODPS(5k)/OTS/HBase/Spark/Storm 等)运维工作,专注于大规模海量数据分布式计算平台运维工作。
阿里云大数据运维经验分享
阿里集团近几年的大规模集群机器数量快速发展,当运维数千台甚至上万规模集群的时候,会遇到诸多挑战,如硬件 配置的差异化,用户数和任务数的急剧膨胀,大压力下的边界效应,小概率事件被触发等。相对以前传统运维来说在规 模和经验方面都在快速发生变化,本演讲将和大家分享阿里在自动化、数据化方面的实战经验,以及从运维转向运营 的一些心路历程。