NVIDIA Triton开源推理服务软件三大功能推动效率提升-电子发烧友网

Microsoft Te ams借助AI生成的实时字幕和转录功能，帮助全球学生和职场人士顺利进行在线会议。用于训练的NVIDIA AI计算威廉希尔官方网站和用于推理语音识别模型的NVIDIA Triton推理服务器进一步提升了这两个功能。

Microsoft Teams 是全球沟通和协作的重要工具，每月有近2.5亿活跃用户。Microsoft Azure 认知服务为Teams提供28种语言的字幕和转录，并将很快能够在NVIDIA GPU上运行关键的计算密集型神经网络推理。

实时字幕功能帮助与会者实时跟踪对话，转录功能方便与会者在日后回顾当时的创意或回看未能参与的会议。

实时字幕对聋哑人、听力障碍者，或者异国与会者特别有用。

NVIDIA Triton开源推理服务软件能够帮助Teams使用认知服务优化语音识别模型。

使用Triton，认知服务能够支持高度先进的语言模型，以极低的延迟实时提供高度准确、个性化的语音转文本结果。同时，可以保证运行这些语音转文本模型的NVIDIA GPU充分发挥其潜力，在消耗更少计算资源的同时，为客户提供更高的吞吐量，进而降低成本。

底层语音识别威廉希尔官方网站作为认知服务中的一个API，开发人员可以使用它定制和运行自己的应用程序——客服电话转录、智能家居控制或为急救人员提供AI助手。

字字达意的AI

认知服务会生成Teams的转录和字幕，将语音转换为文本，并识别说话人。同时也能够识别专业术语、姓名和其他会议背景，提高字幕的准确性。

Microsoft Teams的通话、会议及设备首席项目经理Shalendra Chhabra表示：“这样的AI模型非常复杂，需要数千万个神经网络参数才能识别几十种不同的语言。但模型越大，就越难以经济高效地实时运行。”

NVIDIA GPU和Triton软件能够帮助微软在不牺牲低延迟的情况下，通过强大的神经网络，实现高准确性，确保语音-文本的实时转换。

当启用转录功能时，与会者可以在会议结束后轻松补上错过的内容。

Triton三大功能推动效率提升

NVIDIA Triton有助于简化AI模型部署，并解锁高性能推理。用户甚至可以为自己的应用开发自定义后端。软件的一些关键功能可将Microsoft Teams的字幕和转录功能扩展到更多会议和用户，包括：

流推理：新型流推理功能——通过跟踪语音上下语境，提高延迟、敏感性字幕的准确度，它助力NVIDIA和Azure认知服务合作定制语音转文本的应用程序。

动态合批：批大小指神经网络同时处理的输入样本数量。通过Triton的动态合批，单项推理请求被自动组合成一个批次，因此能够在不影响模型延迟的情况下更好地利用GPU资源。

并发模型执行：实时字幕和转录需要同时运行多个深度学习模型。Triton使开发人员能够在单个GPU上同时完成这些工作，包括使用不同深度学习框架的模型。

即刻启程，借助Azure 认知服务，在您的应用中使用语音转文本的功能，并进一步了解NVIDIA Triton 推理服务软件如何帮助团队大规模部署AI模型。

NVIDIA 将参加 CES 2022，并将在 1 月 5 日凌晨 0 点（北京时间）发表 NVIDIA 特别演讲。

NVIDIA GeForce 高级副总裁 Jeff Fisher 和 NVIDIA 汽车部门副总裁兼总经理 Ali Kani 将展示加速计算在设计、仿真、游戏和自动驾驶汽车方面的新突破。扫描下方海报，即刻将该日程添加到日历！

原文标题：Microsoft Azure 认知服务和NVIDIA AI提升Microsoft Teams实时字幕和转录功能

文章出处：【微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。
审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
5013

浏览量
103245
功能

功能

+关注

关注
3

文章
589

浏览量
29288
开源

开源

+关注

关注
3

文章
3368

浏览量
42567

原文标题：Microsoft Azure 认知服务和NVIDIA AI提升Microsoft Teams实时字幕和转录功能

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

借助NVIDIA GPU提升鲁班系统CAE软件计算效率

本案例中鲁班系统高性能 CAE 软件利用 NVIDIA 高性能 GPU，实现复杂产品的快速仿真，加速产品开发和设计迭代，缩短开发周期，提升产品竞争力。

发表于 12-27 16:24 •152次阅读

Triton编译器如何提升编程效率

在现代软件开发中，编译器扮演着至关重要的角色。它们不仅将高级语言代码转换为机器可执行的代码，还通过各种优化威廉希尔官方网站提升程序的性能。Triton 编译器作为一种先进的编译器，通过多种方式提升

发表于 12-25 09:12 •239次阅读

Triton编译器在机器学习中的应用

1. Triton编译器概述 Triton编译器是NVIDIA Triton推理服务平台的一部分

发表于 12-24 18:13 •404次阅读

Triton编译器功能介绍 Triton编译器使用教程

Triton 是一个开源的编译器前端，它支持多种编程语言，包括 C、C++、Fortran 和 Ada。Triton 旨在提供一个可扩展和可定制的编译器框架，允许开发者添加新的编程语言特性和优化威廉希尔官方网站

发表于 12-24 17:23 •449次阅读

NVIDIA助力提供多样、灵活的模型选择

在本案例中，Dify 以模型中立以及开源生态的优势，为广大 AI 创新者提供丰富的模型选择。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理

发表于 09-09 09:19 •484次阅读

魔搭社区借助NVIDIA TensorRT-LLM提升LLM推理效率

“魔搭社区是中国最具影响力的模型开源社区，致力给开发者提供模型即服务的体验。魔搭社区利用NVIDIA TensorRT-LLM，大大提高了大语言模型的推理性能，方便了模型应用部署，提高

发表于 08-23 15:48 •467次阅读

全新 NVIDIA NeMo Retriever微服务大幅提升LLM的准确性和吞吐量

企业能够通过提供检索增强生成功能的生产就绪型 NVIDIA NIM 推理微服务，充分挖掘业务数据的价值。这些微服务现已集成到 Cohesit

发表于 07-26 11:13 •865次阅读

全新 <b class='flag-5'>NVIDIA</b> NeMo Retriever微<b class='flag-5'>服务</b>大幅<b class='flag-5'>提升</b>LLM的准确性和吞吐量

NVIDIA携手Meta推出AI服务，为企业提供生成式AI服务

NVIDIA近日宣布了一项重大举措，正式推出NVIDIA AI Foundry服务与NVIDIA NIM（NVIDIA Inference

发表于 07-25 16:57 •557次阅读

英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服务和 NVIDIA NIM 推理微服务

发表于 07-25 09:48 •729次阅读

英伟达推出AI模型推理服务NVIDIA NIM

英伟达近日宣布推出一项革命性的AI模型推理服务——NVIDIA NIM。这项服务将极大地简化AI模型部署过程，为全球的2800万英伟达开发者提供前所未有的便利。

发表于 06-04 09:15 •690次阅读

NVIDIA与Google DeepMind合作推动大语言模型创新

支持 NVIDIA NIM 推理微服务的谷歌最新开源模型 PaliGemma 首次亮相。

发表于 05-16 09:44 •459次阅读

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库，用于优化从 PC 到云端的

发表于 04-28 10:36 •588次阅读

利用NVIDIA组件提升GPU推理的吞吐

本实践中，唯品会 AI 平台与 NVIDIA 团队合作，结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）将推理的稠密网络和热

发表于 04-20 09:39 •756次阅读

使用NVIDIA Triton推理服务器来加速AI预测

这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。

发表于 02-29 14:04 •594次阅读

利用NVIDIA产品威廉希尔官方网站组合提升用户体验

UTalk-Doc 将用户指令识别服务吞吐量提升了 5 倍，单个请求响应时间缩减了三分之一，大幅提升服务运行

发表于 01-17 09:30 •713次阅读

搜索历史

NVIDIA Triton开源推理服务软件三大功能推动效率提升

评论

借助NVIDIA GPU提升鲁班系统CAE软件计算效率

Triton编译器如何提升编程效率

Triton编译器在机器学习中的应用

Triton编译器功能介绍 Triton编译器使用教程

NVIDIA助力提供多样、灵活的模型选择

魔搭社区借助NVIDIA TensorRT-LLM提升LLM推理效率

全新 NVIDIA NeMo Retriever微服务大幅提升LLM的准确性和吞吐量

NVIDIA携手Meta推出AI服务，为企业提供生成式AI服务

英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

英伟达推出AI模型推理服务NVIDIA NIM

NVIDIA与Google DeepMind合作推动大语言模型创新

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

利用NVIDIA组件提升GPU推理的吞吐

使用NVIDIA Triton推理服务器来加速AI预测

利用NVIDIA产品威廉希尔官方网站组合提升用户体验