腾讯云异构计算研发工程师(深圳、北京、上海) - Shenzhen, 中国 - Tencent

    Tencent background
    描述
    腾讯云异构计算研发工程师(深圳、北京、上海) 深圳 分享

    分享岗位

    方式1:复制岗位链接

    方式2:分享岗位海报

    手机扫描二维码分享

    收藏 CSIG 点击了解更多BG信息 技术 五年以上工作经验 更新于年04月03日 岗位职责
  • 1.负责高性能计算集群的平台开发和建设工作,构建业界领先的集群算力调度能力、集群网络管理监控能力、集群故障发现和迁移自愈等能力;2.负责主流 AI 框架的云平台适配和性能调优工作,针对业界大模型训练,将主流加速框架(如DeepSpeed、Megatron-LM)结合云平台底层技术特点和优势,打造具备差异化竞争力的 AI 加速平台产品能力;3.负责主流 AI 模型训练和推理性能优化调优工作,提升 AI 推理业务快速部署能力,提供平台算法优化加速能力,能够灵活使用 Triton,TensorRT 等业界主流推理服务和组件,深度结合云原生产品技术架构优势,输出面向不同场景的性能加速最佳实践解决方案;4.负责跟踪 AI行业技术发展趋势,并进行深度探索分析,协同产品制订 AI 技术发展路线和产品规划;5.探索自研AI芯片分布式训练与推理云化能力,打造自研 AI 芯片一体化解决方案能力。
  • 岗位要求
  • 1.人工智能、计算机、数学等相关专业;2.5年以上 AI 研发或项目经验,有云计算领域相关经验优先;3.具备TensorRT,Triton等推理框架和服务部署软件的优化和实践能力;4.熟悉深度学习框架(Pytorch, Tensorflow,等),熟悉各组件和类库,常见AI模型;5.熟悉行业内人工智能平台、机器学习实现方案,熟悉主流云计算厂商 AI 产品特点,有 AI 研发经验者优先;6.熟悉业界流行的显卡虚拟化技术,对Nvidia/AMD/Intel等GPU技术有较深理解的优先;7.对GPU,分布式计算,RDMA,MPI,GPU Direct 等技术有了解和使用经验优先;8.精通C++、Python等开发语言,熟练掌握Linux软件开发技术;9.有一定的管理能力,具备丰富的产品规划和设计经验,对人工智能技术及行业有前瞻性战略思考;10.清晰的逻辑分析和表达能力,乐观积极,具有较强的责任心和执行力。