大数据与AI中台论坛

王力

华为技术有限公司服务与软件研发管理部数据中台系统工程师

个人介绍:

王力,华为技术有限公司服务与软件研发管理部数据中台系统工程师,西安交通大学博士。主要研究分布式计算平台、大数据处理引擎的资源调度技术,获得教育部科技进步二等奖(第3完成人)

议题:

应用强化学习选择spark on yarn的最佳资源参数

议题介绍:

数据中台承载着华为的运营商大数据分析业务,在全球建有300多个局点,最大900+服务器,数据接入量超过2TB/S。数据中台应用spark支持批计算任务,使用spark on yarn完成大数据平台的资源调度,而各局点的应用数据对容器的规格、多少有不同的需求,yarn虽然提供了配置参数接口,但是依赖专家配置费时、费力,且不一定最优。因此,提出应用强化学习选择spark on yarn的最佳资源参数,针对不同业务,学习、尝试,并最终选择spark运行时的最佳参数。该方法不仅可以用作spark运行时的最佳参数选择,对于其它需要配置运行时参数的系统仍然适用。

  • 服务热线:
  • 15101014297
  • 媒体咨询:
  • 13301211220
  • 商务合作:
  • 18911709282
  • 大会邮箱:
  • [email protected]
  • 主办单位:
  • 中国计算机学会(CCF)
  • 承办单位:
  • CCF大数据专家委员会
  • 协办单位:
  • CSDN
  • 中科天玑数据科技股份有限公司
认证
加入CCF入口
x