0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA 招聘 | NVIDIA 最新热招岗位!一起迎接未来加速计算!

NVIDIA英伟达 来源:未知 2023-06-14 18:35 次阅读

NVIDIA 计算架构团队和NVIDIA 计算专家团队正在热招!

如果你对加速计算领域充满热情,并且希望与优秀的威廉希尔官方网站 专家一起合作,那么这个机会将是你展现才华的优质平台,快来加入

NVIDIA 计算架构团队

热门岗位:

简历请投递至:

sh-recruitment@nvidia.com

Deep Learning Performance Architect - Triton / LLM - TensorRT

工作内容:围绕深度学习端到端 AI 软件全栈,包括但不限于:训练框架、核心计算库、推理优化工具(比如 TensorRT)、AI 编译器、模型压缩等全栈软件栈,以及可以在 AI 软件全栈基础上影响到下一代甚至下两代硬件架构的特性设计。

技能要求: 良好 C++ 编程,熟悉 AI 软件栈底层或者计算机体系结构,熟悉上层算法Python 是加分项。

工作地点:北京 / 上海

Deep Learning Performance Architect - TensorRT

工作内容:NVIDIA 深度学习推理引擎 TensorRT 的设计、开发和维护工作(比如,TensorRT 模型导入的流程和相关工具,图优化,算子的 CUDA 实现及代码生成,算子性能优化等),以及对当前主流的深度学习模型使用 TensorRT 进行推理的性能进行分析和优化。同时,还将与 NVIDIA GPU 体系结构设计团队合作,来推动 NVIDIA 深度学习解决方案的软硬件协同设计和研发。

技能要求:熟练掌握 C++ 编程。


加分技能 / 经验: 度学习框架 / 深度学习编译器开发,性能分析 / 建模 / 优化相关的方法论 / 工具,计算机体系结构相关知识,CUDA kernel 开发 / 优化。

工作地点:上海 / 北京


Deep Learning Performance Architect - Operator

工作内容:针对不同 GPU 架构为 TensorRT、cuDNN、cuBLAS2、cuSPARSE 等深度学习算子库提供高性能基础算子以及算子融合实现,包含在线代码生成,代码融合等相关开发工作,以及根据当代 GPU 优化瓶颈影响后续硬件架构特征设计和验证工作。

技能要求:良好 C++ 编程、熟悉计算机体系结构,有 TVM、MLIR 相关开发经验是加分项。

工作地点:上海 / 北京

Deep Learning Performance Architect

工作内容:围绕运算架构的全栈优化,包括但不限于:深度学习模型分析与预测、架构的性能分析、编译器性能分析,以及对主流运算架构和软件生态的分析。使 NVIDIA 软件生态与计算架构更好的支持主流应用。

技能要求:良好 C++ / Python 编程,熟悉 AI 软件或者计算机体系结构。

工作地点:上海

上下滑动查看更多职位详情

团队介绍

算力是 AI 时代的基础设施,而“后摩尔定律时代”,软硬件协同设计,才是加速计算的未来!

NVIDIA 计算架构团队历经 CUDA 并行编程模型从起步至今的所有阶段,其间参与了数代通用 GPU 计算架构及之上的包括 cuDNN、TensorRT、底层高性能算子、并行编程语言在内的加速软件栈的研发工作。该团队同时参与关键机器学习模型的算法及框架优化。

目前,该团队开放多个职位等你的加入!与我们共同书写下一代 AI 计算架构的未来!

NVIDIA 计算架构团队旨在推动算法、并行编程模型、核心加速软件库及 GPU 体系结构的协同设计和演化,在高速发展的深度学习算法与 GPU 硬件体系结构之间建立桥梁,并研发先进的软硬件协同的加速计算解决方案。

该团队从高性能计算、深度学习、自动驾驶等计算应用领域出发,跟踪学界、工业界前沿算法,并掌握其发展方向;通过对前沿算法(比如:神经网络结构)的深入理解,分析并提出芯片架构的需求,包含指令集、编程模型、计算能力、访存带宽、片上存储、片上网络及网络互联等。

同时,承担基于架构的计算加速软件栈的开发及产品化工作。自底层加速核心算子开发及优化,基于硬件加速的并行编程模型的研发和编译,TensorRT、cuDNN 等核心加速库,直到上层训练框架、编译优化。以及,针对模型的混合精度、稀疏矩阵训练及量化方法开发。

上下滑动查看更多详情

团队发展

该团队基于硬件架构开发软件、编程模型、算法实现,通过算法、软件开发实践反馈并推动硬件架构优化,形成闭环,最终实现软件、编程模型及硬件架构的协同演化和迭代,达到极致计算加速的目标:

  • 建立下一代芯片性能模型、搭建芯片性能分析平台、调研下一代芯片新特性

  • 研发及设计新的加速指令、开发原型代码及编程模型、迭代优化下一代芯片架构

  • 跟踪下一代芯片新特性在应用中的落地实现(算子实现、编译等)

  • 开发集成最终软件产品库 - TensorRT,cuDNN

  • 优化训练框架(MLPerf 各项优化)

  • 开发混合精度、稀疏矩阵及量化方法

上下滑动查看更多详情

NVIDIA 计算专家团队

热门岗位:

简历请投递至:

sh-recruitment@nvidia.com

Developer Technology Engineer

工作内容:

  • 包括大语言模型、生成式 AI、推荐系统在内的深度学习、机器学习、数据分析领域新威廉希尔官方网站 ,以及编程实现、优化、模型、算法等方面的研究和开发;

  • 工业界实际应用的深度分析和优化,以保证该类应用在当前和未来的 NVIDIA 架构上都能保持卓越性能;

  • 为关键客户(业界头部公司)提供合适的 AI 解决方案;

  • 和 GPU / CPU / DPU 架构团队、研究团队、应用库和开发工具团队、系统软件团队等紧密合作来影响下一代产品架构、软件平台和编程模式的设计与开发;

  • 与世界各地的优秀同事一起助力深度学习威廉希尔官方网站 在互联网、交通、金融、医疗等各领域的落地。

基本要求:

  • 计算机科学相关专业优秀硕士、博士毕业生;

  • 拥有良好的 C / C++ / Python 编程能力,良好的软件设计和开发能力;

  • (二选一)有并行计算编程基础,有 CUDA / C / C++ / Python 编程经验;

  • (二选一)拥有深度学习,机器学习领域的扎实理论基础,熟悉常见的深度学习网络或机器学习算法;

  • 良好的沟通能力、解决问题能力、时间管理能力和任务优先级管理能力;

  • 良好的英文威廉希尔官方网站 文档读写能力和日常听说沟通能力。

工作地点:北京 / 上海 / 深圳 / 台北

上下滑动查看更多职位详情

团队介绍

NVIDIA 计算专家团队(DevTech)专注于各种深度学习算法、科学计算、数据分析和云端应用;在 NVIDIA 平台上进行性能分析以及优化,以充分发挥 NVIDIA GPU / CPU / DPU,集群和数据中心强大的算力,使其达到,或者接近“光速”(SOL)水平的高级威廉希尔官方网站 团队。

该团队与世界上威廉希尔官方网站 领先的企业、高校、研究院所合作,共同推动和加速各项 AI 应用的落地。通过与用户深度紧密的合作,在大语言模型、生成式 AI、推荐系统、自动驾驶、自然语言处理、视频和图像理解、语音识别与合成,游戏等领域取得了累累硕果。该团队成为帮助客户发挥硬件平台和软件栈综合算力的中坚力量,能够为产品研发团队提供性能优化、设计原型和william hill官网 案例。

团队目标:在 NVIDIA 系统上,将各类应用优化到性能极致!

以打造大语言模型(LLM)应用为例,既可以直接使用 NVAIE / NVIDIA Nemo Service,也可以使用应用框架(Nemo FW、Triton+TensorRT、FT等)来训练和部署模型,也可以基于 cuDNN / TensorRT 等软件库自己开发自己的框架,还可以基于 CUDA 来完全定制化自己的 pipeline,或者也可以混合采用这些方法。

如何选择一种合适的方法,其关键在于取得应用场景、性能要求、平台灵活性、时间成本、威廉希尔官方网站 成本之间的平衡。NVIDIA 计算专家团队就是帮助客户和 NVIDIA 解决这个问题的。

上下滑动查看更多详情

团队发展

团队成员主要来自北京、上海、深圳、台北、首尔等地。

科学计算时代,当整个市场都还只关注于不断扩大通用硬件的规模时,NVIDIA 推出了加速计算 GPGPU 和 CUDA 编程模型。GPU 和 CUDA 这一全新的加速计算范式,为业界带来了源源不断的加速,但是也对应用的开发和优化提出了挑战。

在不断改进基础库性能的同时,NVIDIA 组建了一支特别团队,关注更为具体的应用。团队成员们不仅有深厚的计算机功底(从计算机体系结构、CUDA 编程,到编译原理、网络互连),还拥有各个领域的专业知识。这支团队不但可以从 GPU 编程方面对程序进行优化,更能从算法、模型方面提出改进建议,这使得 NVIDIA GPU 从科学计算领域脱颖而出。

随着深度学习的高速发展,该团队也在续写着相同的故事。对于 AI 中的神经网络,从代码和算法两个方面对其进行优化。代码方面涉及 CUDA、GPU 库,多机多卡网络互连等各个领域;而算法包括了模型压缩、量化、剪枝、混合精度训练、梯度压缩等,其最终目标都是在模型精度没有损失,或者损失不大的情况下,提高训练和预测的速度。

对于一个基于 AI 的实际工业项目,除了神经网络以外,系统内还包括了很多其他模块,神经网络在其中耗时只占 1/3 - 1/2。以互联网核心的推荐系统为例,其包括了召回、过滤、粗排、精排、离线训练、在线训练、ETL、特征工程等模块和流程。该团队致力于提供全流程的参考解决方案,让尽可能多的模块运行在 GPU 上,进而为应用带来显著加速。

上下滑动查看更多详情

点击“阅读原文”,或扫描下方海报二维码观看 NVIDIA 创始人兼 CEO 黄仁勋在 COMPUTEX 2023 的主题演讲直播回放,主题演讲中文字幕版已上线,了解 AI、图形及其他领域的最新进展!


原文标题:NVIDIA 招聘 | NVIDIA 最新热招岗位!一起迎接未来加速计算!

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3782

    浏览量

    91229

原文标题:NVIDIA 招聘 | NVIDIA 最新热招岗位!一起迎接未来加速计算!

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    盘点NVIDIA 2024年的创新成果

    在2024年,AI 的影响力已经扩展到加速计算和数据科学等多个关键领域,成为驱动各行各业威廉希尔官方网站 革新和产业升级的关键因素。在这年里,NVIDIA 又带来了哪些创新成果,实现了哪些突破?跟
    的头像 发表于 01-02 14:32 112次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    许可证模型的加速令牌或SIMULIA统许可证模型的SimUnit令牌或积分授权。 4. GPU计算的启用 - 交互式模拟:通过加速对话框启用,打开求解器对话框,点击“
    发表于 12-16 14:25

    NVIDIA加速全球大多数超级计算机推动科技进步

    HPCwire 读者和编辑选择奖。 自 2006 年发布 CUDA 以来,NVIDIA 不断推动 AI 和加速计算的进步,最新发布的全球最强超级计算机 TOP500 榜单突显了该公司
    的头像 发表于 11-24 14:38 336次阅读
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>全球大多数超级<b class='flag-5'>计算</b>机推动科技进步

    NVIDIA加速计算如何推动医疗健康

    近日,NVIDIA 企业平台副总裁 Bob Pette 在 AI Summit 场演讲中重点谈论了 NVIDIA 加速计算如何推动医疗健康
    的头像 发表于 11-20 09:10 303次阅读

    NVIDIA向开放计算项目捐赠Blackwell平台设计

    近日,在美国加利福尼亚州举行的 OCP 全球峰会上,NVIDIA 宣布已把 NVIDIA Blackwell 加速计算平台的些基础元素捐赠
    的头像 发表于 11-19 15:30 205次阅读

    日本企业借助NVIDIA产品加速AI创新

    日本领先企业和大学正在使用 NVIDIA NeMo、NIM 微服务和 NVIDIA Isaac 加速 AI 创新。
    的头像 发表于 11-19 14:34 327次阅读

    利用NVIDIA RAPIDS加速DolphinDB Shark平台提升计算性能

    DolphinDB 是家高性能数据库研发企业,也是 NVIDIA 初创加速计划成员,其开发的产品基于高性能分布式时序数据库,是支持复杂计算和流数据分析的实时
    的头像 发表于 09-09 09:57 478次阅读
    利用<b class='flag-5'>NVIDIA</b> RAPIDS<b class='flag-5'>加速</b>DolphinDB Shark平台提升<b class='flag-5'>计算</b>性能

    NVIDIA加速计算和生成式AI领域的创新

    在最新发布的公司 2024 财年可持续发展报告开篇的封信中,NVIDIA 创始人兼首席执行官黄仁勋介绍了 NVIDIA加速计算和生成式
    的头像 发表于 09-09 09:18 578次阅读

    借助NVIDIA超级计算加速量子计算发展

    科学期刊《自然》(Nature)本月早些时候发表了项研究,通过使用 NVIDIA 驱动的超级计算机,验证了量子计算的商业化途径。
    的头像 发表于 07-25 09:55 534次阅读

    英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服务和 NVIDIA NIM 推理微服务,与同样刚推出的 Llama 3.1 系列开源模型一起,为全球企业的生成式 AI
    的头像 发表于 07-25 09:48 719次阅读

    HPE 携手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 变革

    by HPE 包含了可持续的加速计算产品组合以及全生命周期服务,将简化 AI 创造价值的过程,加速生成式 AI 的发展步伐。 NVIDIA AI Computing by HPE 由
    的头像 发表于 06-21 14:39 383次阅读

    NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 变革

    作为极具开创性的站式“交钥匙”私有云人工智能(private-cloud AI)解决方案,NVIDIA AI Computing by HPE 包含了可持续的加速计算产品组合以及全生
    的头像 发表于 06-20 17:36 736次阅读

    NVIDIA 通过 CUDA-Q 平台为全球各地的量子计算中心提供加速

    德国、日本和波兰的超级计算机利用 Grace-Hopper 和量子-经典加速超算平台推进量子计算研究     德国汉堡 —— 国际超算大会(ISC)—— 2024 年 5 月 13 日
    发表于 05-13 15:21 201次阅读
    <b class='flag-5'>NVIDIA</b> 通过 CUDA-Q 平台为全球各地的量子<b class='flag-5'>计算</b>中心提供<b class='flag-5'>加速</b>

    使用NVIDIA Triton推理服务器来加速AI预测

    这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。
    的头像 发表于 02-29 14:04 594次阅读

    2024春季招聘,最热门的岗位是……?鸿蒙

    。根据智联招聘发布的《2024年春市场行情周报》显示,就业市场回暖复苏, 鸿蒙相关岗位成为招聘亮点 。 鸿蒙市场如火如荼 根据智联招聘数据
    的头像 发表于 02-28 22:07 582次阅读
    2024春季<b class='flag-5'>招聘</b>,最热门的<b class='flag-5'>岗位</b>是……?鸿蒙