阿里巴巴集团

技术风险部-稳定性运维/开发专家-杭州 (BB-6B63A)

Found in: Neuvoo CN

Description:

团队介绍:

阿里巴巴集团技术风险部作为承接世界顶尖电商平台、云计算平台、本地生活平台等高度复杂系统稳定性的团队,致力于保障天猫、淘宝、阿里云等阿里巴巴旗下各生产环境的高可用以及资金零差错。如何保障客户、公司、合作伙伴系统高于99.99%的可用性以及无资金差错,是我们面临的巨大挑战。传统的运维思路和文化无法彻底解决稳定性问题,需要建设体系化的技术风险防控能力管理风险,为此我们打造了直接隶属阿里巴巴集团CTO的技术风险团队。团队一方面围绕电商、云计算、本地生活、广告搜索等丰富的业务形态,解决高速发展中的风险防控问题,另一方面围绕故障快速发现、自动定位、自愈、演练、变更风控和红蓝攻防等方面建设平台能力,经过多年的建设沉淀打造出一整套技术风险防控和稳定性建设的解决方案,将阿里巴巴集团整个分布式架构和技术风险能力组合在一起。部门技术氛围浓厚,适合有探索精神和挑战前沿的人才,对于致力于从事技术风险防控、系统稳定性、运维、DevOps和SRE方面的同学,这里提供业内最先进的经验,专业的指导和优质的成长环境。

岗位描述:

1、负责故障应急,负责核心应用运维,聚焦经济体可用率与重大故障的快速发现、快速定位与快速恢复;
2、负责攻防演练,担任红军角色,负责故障风险挖掘分析,防御部署,提升故障快速恢复能力;
3、负责平台建设,聚焦故障预防、故障快恢、故障自愈等能力平台的设计与研发,提升经济体整体应急能力。

岗位要求:

1、大学本科及以上学历,2年以上开发/运维经验,具有较好的技术敏感度和故障排查经验,熟悉Java/Python/C/C++至少1种开发语言以及对应开发框架;
2、具备扎实的计算机专业基础,包括算法和数据结构、容器、操作系统、计算机体系结构、计算机网络、数据库等,具有大型网站运维和平台开发经验优先;
3、良好的逻辑思维、团队协作、沟通能力,乐于分享,良好的客户服务意识;有很强的分析复杂问题和解决复杂问题的能力,有强烈的责任心和使命感。
我们鼓励人人践行公益,同学如参与过公益活动,有相关证明,也欢迎附在简历中。参考依据包括但不限于:全国志愿服务信息系统开具的志愿服务证明、“人人3小时”公益平台公益时证书、志愿服务组织(含社会团体、社会服务机构、基金会)授予的志愿服务证明等。

calendar_today3 days ago

Similar jobs

location_onHangzhou, China

work 阿里巴巴集团

Apply:
I expressly authorise the Terms and Conditions