地点:北京富力万丽酒店 · 首府宴会厅 4
时间:2019年9月7日 9:00—12:00
DevOps、AIOps是近些年来非常火热的话题。为此,本论坛主要就AIOps、DevOps理念,AIOps和DevOps的挑战和机遇,AIOPs和DevOps落地实践以及AI在开发和运维中发挥的重要作用和具体实践为主要内容,重点探讨AI与开发以及运维的结合。
黄哲铿,中通商业CTO,前1药网技术VP、海尔农业电商 CTO、1号店技术总监,畅销书《技术管理之巅》作者,“技术领导力社区”发起人,擅长大型供应链系统研发、全渠道电商系统研发、大型技术团队治理,个人拥有多项技术发明和专利。
京东数科有着非常复杂的运维场景,数千的微服务应用,十几万应用实例,既要保障业务的可用性,也需要结合运行数据和业务增长的预测,合理的控制容量和成本。 本次分享结合生产实践,阐述运维中的痛点问题是如何通过大数据,智能化的方式优化的,以及相关的AIOPS平台是如何建设如何运用的。 1. 运维如何做到从响应式维护,到计划性维护,再到预见性维护? 2. 运维如何从依赖运维专家经验,到SOP标准化操作,到无人操作。 3. 智能运维中的实时异常检测如何落地,和传统的阈值监控有什么差别 4. 智能运维中,如何运用运维数据分析,主动识别和解决系统中的异常点和待改进型。 5. 其他数据化智能化运维工具介绍。
EMMF(Eleme Modular Monolith Framework )是一个模块化的单体应用框架,支持业务系统以模块化的方式构建一个单体应用。基于EMMF的业务模块,可独立的,自动化的拆分成一个微服务进行独立部署。使业务系统具备单体应用的管理简单、快速迭代的特点的同时,也支持拆分成多个微服务的方式部署,以满足业务系统不断发展的需要。同时也提高了业务系统的可测试性。一个业务的多个微服务,能够更容易的合并在一起进行测试工作。
越来越多企业选择将应用托管上云或开发云原生应用,享受云计算提供一站式资源申请和各种云原生接口的便利。由于应用与各类云服务之间产生了紧密的联系,运维产品需要关注应用与云资源的运行状态,包括产生的各类指标、告警、事件与日志等,当应用异常时能帮助企业快速找到异常的根因,华为云AIOps团队在不断探索各类方法解决这类问题,包括建立应用与资源的关系,通过AI算法减少告警风暴,并洞察到异常的根因。
一、阿里云和智能运维 1、集团上云,规模带来的运维挑战 2、无人值守是目的,自动化是手段 3、无人值守的最后一公里:客户侧运维开发 二、自动化三剑客之弹性伸缩 1、最大化的节省成本 2、阿里面试题:为什么某明星发布恋情,会导致微博服务异常? 3、基于AI预测的弹性伸缩 三、自动化三剑客之资源编排 1、基础设施即代码 2、容器服务使用资源编排最佳实践 四、自动化三剑客之运维编排 1、运维即代码 2、事件驱动运维的最佳实践 - 抢占型实例和Always On实例 3、定时运维的最佳实践 - 批量定时开关机 4、跨区域运维的最佳实践 - 跨区域复制ECS
扫码回复:大会,加入大会福利群