工作机会
>
Beijing

    大模型分布式训练研究员 - Beijing, 中国 - Lenovo

    Lenovo
    Lenovo background
    全职
    描述

    Description and Requirements

    岗位职责:

    1.负责深度学习大模型的分布式训练系统的架构设计与开发,优化模型训练效率和资源利用率;

    2.研究并实现基于GPU等高性能计算平台的大规模深度学习模型并行训练算法;

    3.对现有深度学习框架和分布式训练框架(如PyTorch、TensorFlow、DeepSpeed、Colossal-AI,megatron)进行深度定制和扩展,以满足大规模模型训练的需求;

    4.与算法团队紧密合作,解决在超大规模数据集上模型训练过程中的性能瓶颈问题;

    5.设计并实现模型训练监控系统,包括但不限于训练进度、资源占用情况、训练效果可视化等;

    6.持续跟踪最新的分布式训练技术发展趋势,将前沿研究成果应用于实际项目中。

    任职要求:

    1.计算机科学或相关专业硕士及以上学历,具有3年以上深度学习领域工作经验,有大型互联网公司或者AI实验室工作经验者优先;

    2.熟练掌握至少一种深度学习框架和分布式训练框架(如PyTorch、TensorFlow),并具备丰富的模型开发与训练经验;

    3.精通分布式系统原理,熟悉常见的分布式计算框架(如MPI、DeepSpeed、Colossal-AI、OneFlow),有大规模并行计算和分布式训练系统开发经验;

    4.具备良好的算法基础,对深度学习模型训练优化有深入理解和实践经验,包括但不限于梯度压缩、通信优化、异步训练等;

    5.有大模型分布式训练理论和实践经验,熟悉国内外主流基础大模型;

    6.具备优秀的分析和解决问题的能力,能够独立进行复杂问题定位与解决;

    7.对于计算机体系结构、操作系统、网络编程等相关知识有一定理解;

    8.英语读写能力强,能快速阅读英文文献和技术文档,追踪国际最新研究动态和技术趋势。

    加分项:

    1.在顶级会议或期刊(如NIPS, ICML, ICLR, JMLR等)发表过关于分布式训练或深度学习相关论文;

    2.参与过开源分布式训练项目,并有显著贡献。

    Additional Locations : * China - Beijing - 北京(Beijing) * China * China - Beijing * China - Beijing - 北京(Beijing)


  • Tencent Beijing, 中国

    机器学习平台高级算法研究员-大模型应用(广告模型平台) 北京 分享 分享岗位 · 方式1:复制岗位链接 · 方式2:分享岗位海报 · 手机扫描二维码分享 · 收藏 TEG 点击了解更多BG信息 技术 三年以上工作经验 更新于年04月29日 岗位职责 1.负责大语言模型在捜广推场景应用相关核心能力研发,包括大模型微调能力,相关模型算法调优以及性能优化等 ;2.负责大语言模型在捜广推场景应用时在线推理性能优化和推理策略调优;3.负责大语言模型在推荐场景应用的前沿算法研究和优化。 · 岗位要求 1.计算机相关专业,本科及以上学历,4年及以上工作 ...


  • Lenovo Beijing, 中国 全职

    Description and Requirements · 工作内容: · 工作包括但不限于 · •参与机器视觉模型(CV),机器视觉语言模型(VLM),以及大语言模型(LLM)的研发。 · •CV和LLM模型量化压缩技术的研发,实现模型的小型化。 · •使用C/C++编程语言实现模型在端侧设备上的高速推理与优化,以及跨平台的编译和移植,包括Windows, Android, Linux。 · 任职资格: · •3-5年的研发经验,领域包括机器视觉,视觉语言模型,和大型语言模型等。 · •精通PYTHON和C++编程 · •熟悉常用模型训练框架,如P ...


  • WorldQuant Beijing, 中国

    WorldQuant develops and deploys systematic financial strategies across a broad range of asset classes and global markets. We seek to produce high-quality predictive signals (alphas) through our proprietary research platform to employ financial strategies focused on exploiting mar ...


  • Keywords Studios Beijing, 中国 全职

    We are seeking a highly skilled and experienced Senior Technical Artist to join our company. As a Senior Technical Artist, you will be responsible for providing technical leadership to our growing team of TAs, solving complex technical problems, overseeing the technical aspects o ...


  • Amazon Connect Technology Services (Beijing) Co., Ltd. Beijing, 中国 全职

    At Amazon Web Services, we are working to be the most customer-centric company on earth. To get there, we need exceptionally talented, bright, and driven people. Amazon is continually evolving and is a place where motivated employees thrive and also where employee ownership and a ...


  • Tencent Beijing, 中国

    #QQ短视频机器学习工程师# 北京 分享 分享岗位 · 方式1:复制岗位链接 · 方式2:分享岗位海报 · 手机扫描二维码分享 · 收藏 PCG 点击了解更多BG信息 技术 三年以上工作经验 更新于年04月29日 岗位职责 1.负责大规模推荐场景下,通过对深度学习算法和工程的优化提升业务效果;2.负责机器学习基础能力的建设,提升研发效率和系统性能。 · 岗位要求 1.有推荐/搜索/广告场景下算法优化项目经验,熟悉常见深度学习算法模型,熟练掌握 Python/C++;2.熟悉Tensorflow、PyTorch等框架,熟悉分布式训练与推理, ...


  • Siemens Ltd., China Beijing, 中国 Fixed Term

    加入西门子,共创明日世界 Role Purpose: Siemens Digital Industry Division (DI) is an innovation and technology leader in industrial automation and digitalization. · 西门子数字化工业集团(DI)是工业自动化、电气自动化、工业数字化、工业4.0和智能制造领域的创新引领者。 · DI DBO (Digital Business Office)is responsible for establishing, improve ...


  • Digital China Beijing, 中国

    工作职责 · 负责大数据平台项目设计与规划1.与客户合作,了解数据平台的需求和目标,并将其转化为明确的产品规划和路线图2.协调跨部门团队,包括工程师、设计师和业务团队,确保产品开发和实施的顺利进行3.负责产品功能的定义和设计,确保产品满足客户需求和市场要求4.监督产品开发周期,确保按时交付高质量的产品5.与客户保持究切联系,及时解决问题并提供支持,确保客户满章度6.分析市场趋势和竞争对手,为产品增加竞争优势和创新点7.提供关于产品功能、优势和最佳实践的培训和支持,包括内部团队和客户培训8.定期向客户和内部管理层汇报产品开发进展和绩效任职资格1.本科及以 ...


  • NTT DATA Beijing, 中国

    Job Description · 1. 作为架构设计人员协助项目经理实施大型集成项目,协助产品经理,完成所分配的各项工作任务 · 2. 根据项目范围和需求规划集成平台搭建和接口的内容设计,跟踪新技术发展,并将其应用于系统设计及实施中 · 3. 负责大型平台集成项目实施过程中技术难点攻克,提供性能优化,系统优化及安全性策略 · 4. 依照公司及客户要求的标准制定和维护项目相关的文档,协助产品经理,参与系统的要件定义/功能设计/运维设计等各项工作任务 · 5. 对公司别的团队提供架构、数据库调优等技术方面支持,协助其它技术人员解决业务 · • 5年以上架构 ...


  • Tencent Beijing, 中国

    机器学习训练平台专家工程师(广告模型平台) 北京 分享 分享岗位 · 方式1:复制岗位链接 · 方式2:分享岗位海报 · 手机扫描二维码分享 · 收藏 TEG 点击了解更多BG信息 技术 五年以上工作经验 更新于年03月19日 岗位职责 1.负责大规模稀疏模型训练平台优化,包括同步/异步,GPU多机多卡训练框架等,提供高性能稳定的广告模型训练平台;2.负责腾讯广告业务场景的落地,紧贴业务需求,不断优化模型训练的性能;3.积极跟进AI学术界和业界的最新动态,优化内部技术方案,提升平台性能,不断推进AI架构升级。 · 岗位要求 1.熟悉掌握常 ...


  • Tencent Beijing, 中国

    微信NLP算法研究员(北京/深圳/上海) 北京 分享 分享岗位 · 方式1:复制岗位链接 · 方式2:分享岗位海报 · 手机扫描二维码分享 · 收藏 WXG 点击了解更多BG信息 技术 两年以上工作经验 更新于年04月17日 岗位职责 1.参与大规模 AI 系统的研发与落地,包括但不限于;2.优化大规模预训练模型的训练效率、提升训练稳定性;3.应用监督学习、强化学习等技术提升通用模型的表现;4.研发提升生成模型准确性、时效性、无害性的技术方案;5.参与WeLM的优化以及大模型在业务场景的落地。 · 岗位要求 1.硕士以上学历,计算机相关专 ...


  • Tencent Beijing, 中国

    机器学习高级后台研发工程师(推理平台方向) 北京 分享 分享岗位 · 方式1:复制岗位链接 · 方式2:分享岗位海报 · 手机扫描二维码分享 · 收藏 TEG 点击了解更多BG信息 技术 三年以上工作经验 更新于年03月29日 岗位职责 1.负责广告场景推理平台功能研发与性能优化,支撑广告业务持续升级;2.负责推理功能研发与推理加速,深入优化推理性能 或 负责模型存储模块研发,支撑异构存储;3.积极跟进学术界和业界的最新动态,引入业界先进架构与优化方案。 · 岗位要求 1.熟悉Linux开发环境,良好的系统编程、数据结构、算法基础、系统设 ...


  • Lenovo Beijing, 中国

    Description and Requirements · 职位介绍:1. 负责研发领域的基于大语言模型的应用开发和工程化落地工作,包括但不限于基础模型训练、微调、推理部署与加速等;2. 与产品、数据、开发等同事密切合作,生产萃取高质量私有领域训练数据以供训练和评估模型质量;3. 带领团队将大模型,包括大模型的动态加载算法,模型优化加速算法4. 知识图谱相关算法和技术预研、落地;5. 有较强的数学基础,有一定的算子设计能力3. 至少 2 年大型语言模型(如GPT、BERT等)的研究、开发和应用经验,有模型工程化落地经历,具备规模化并行训练 & 推理加 ...


  • Tencent Beijing, 中国

    多模态资深算法工程师 北京 分享 分享岗位 · 方式1:复制岗位链接 · 方式2:分享岗位海报 · 手机扫描二维码分享 · 收藏 PCG 点击了解更多BG信息 技术 两年以上工作经验 更新于年04月18日 岗位职责 1.负责面向热点领域的,基于LLM的多模态大模型的构建,包括预训练、指令微调、训练和推理加速、模型评测等技术;2.探索多模态大模型技术在热点事件发现、理解与生成方向的应用,为热点内容创作、运营、交互等各环节提供更智能化的能力支持;3.优化现有热点算法,包括视频分类、视频摘要、热点事件图谱、视频检索等方向研发工作,结合实际业务需求 ...


  • Tencent Beijing, 中国

    #NLP资深算法工程师# 北京 分享 分享岗位 · 方式1:复制岗位链接 · 方式2:分享岗位海报 · 手机扫描二维码分享 · 收藏 PCG 点击了解更多BG信息 技术 两年以上工作经验 更新于年04月17日 岗位职责 1.负责面向热点领域大模型的构建,包括预训练、指令微调、训练和推理加速、模型评测等技术;2.探索大语言模型技术在热点事件发现、理解与生成方向的应用,为热点内容创作、运营、交互等各环节提供更智能化的能力支持;3.优化现有热点算法,包括文本生成、文本分类、摘要生成、热点事件图谱、检索问答等方向研发工作,结合实际业务需求与数据,研 ...


  • Tencent Beijing, 中国

    机器学习后台开发工程师(广告模型平台) 北京 分享 分享岗位 · 方式1:复制岗位链接 · 方式2:分享岗位海报 · 手机扫描二维码分享 · 收藏 TEG 点击了解更多BG信息 技术 三年以上工作经验 更新于年02月28日 岗位职责 1.负责广告场景模型平台研发,支撑广告业务持续升级;2.负责训练/发布系统优化,深入优化计算/IO性能,降低资源成本;3.积极跟进AI业界和学术界的新进展,引入相关方案优化平台能力。 · 岗位要求 1.熟悉Linux开发环境,良好的系统编程、数据结构、算法基础、系统设计能力;2.掌握Java/Python/G ...


  • Tencent Beijing, 中国

    微信计算机视觉高级算法研究员-OCR方向 北京 分享 分享岗位 · 方式1:复制岗位链接 · 方式2:分享岗位海报 · 手机扫描二维码分享 · 收藏 WXG 点击了解更多BG信息 技术 两年以上工作经验 更新于年03月22日 岗位职责 负责与文档理解相关的计算机视觉技术(如文档增强、文字检测与识别、文档重建与理解等)的技术研发与全平台部署,以及相关技术在微信基础功能、视频号、搜一搜、微信读书、企业微信等业务场景的落地。 · 岗位要求 1.硕士以上学历,计算机相关专业;2.精通计算机视觉一个或多个细分领域,特别是图像分类、目标检测、图像分割 ...


  • Tencent Beijing, 中国

    微信搜索机器学习架构工程师 北京 分享 分享岗位 · 方式1:复制岗位链接 · 方式2:分享岗位海报 · 手机扫描二维码分享 · 收藏 WXG 点击了解更多BG信息 技术 三年以上工作经验 更新于年04月17日 岗位职责 1.参与WeLM的优化以及大模型在业务场景的落地;2.负责业务机器学习相关平台的建设,和负责模型的推理性能分析及优化;3.分析优化后台服务调度机制与计算处理逻辑;提升服务器利用率与调度性能;4.参与分布式爬虫系统的建设,提升海量信息的抓取效果。 · 岗位要求 1.本科及以上学历,具备三年及以上模型后台相关工作经验;2.熟 ...


  • Tencent Beijing, 中国

    大模型算法工程师 北京 分享 分享岗位 · 方式1:复制岗位链接 · 方式2:分享岗位海报 · 手机扫描二维码分享 · 收藏 PCG 点击了解更多BG信息 技术 两年以上工作经验 更新于年03月28日 渴望为世界带来新意的人,早已对描绘未来的"热词"不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新,最终能带来美好的、撼动人心的改变。 · 岗位职责 1.负责大模型微调相关的工作,包括但不限于:数据样本准备,高效训练等;2.探索研究如何从经典IP小说原文中 ...


  • Tencent Beijing, 中国

    QQ#多模态内容理解高级算法研究员# 北京 分享 分享岗位 · 方式1:复制岗位链接 · 方式2:分享岗位海报 · 手机扫描二维码分享 · 收藏 PCG 点击了解更多BG信息 技术 不限 更新于年05月04日 岗位职责 1.负责腾讯社交线内容业务如QQ视频,QQ群,QQ频道,QQ空间等业务内容理解的算法研发;2.通过研究研发表征预训练模型,多模态语言模型(MLLM),解决海量异构内容(包括文本,图片,图文,视频等)理解的准确度、灵活度、计算效率等上的问题;3.结合产品业务需求,参与研发统一内容理解算法技术体系,从多模态预训练,多模态SFT, ...