NVIDIA发布新的推理软件,创造互动对话AI新时期

 行业动态     |      2022-08-08 10:20:20    |      沥拓

  

  中国苏州——GTCChina——2019年12月18日——NVIDIA今天发布了一个突破性的推理软件。有了这个软件,世界各地的开发者都可以实现会话AI应用,推理延迟大大降低。在此之前,巨大的推理延迟一直是实现真实互动的主要障碍。

  NVIDIATensorRT™7作为NVIDIA为了实现更智能的第七代推理软件开发套件AI人机交互打开了一扇新的大门,从而实现了与语音代理、聊天机器人和推荐引擎的实时交互。

  据JuniperResearch估计全世界有32个.设备中使用了5亿个数字语音助手。到2023年,这一数字预计将达到80亿,超过当今世界总人口。

  TensorRT7.内置新的深度学习编译器。编译器可以自动优化和增加基于转换器的递归神经网络和神经网络。这些日益复杂的神经网络是AI语音应用所必需的。CPU与上运行相比,会话式AI零件速率提高了10倍以上,从而将延迟降低到实时交互所需的300ms阀值以下。

  NVIDIA创始人兼CEO黄仁勋在GTCChina主题演讲说:“我们已经进入了一个机器,立即理解人类语言AI新时期。TensorRT这使得它成为可能,并为世界各地的开发人员提供工具,使他们能够更快地构建和部署更智能的会话AI服务,从而实现更自然的服务AI人机交互。”

  世界上最大和最创新的公司已经被使用NVIDIA的会话式AI加速功能。第一批使用NVIDIA会话式AI加速能力的企业包括阿里巴巴、百度、滴滴出行、美团、快手、安全、搜狗、腾讯、巨量引擎等。

  搜狗公司为全球使用频率最高的手机应用微信提供搜索服务。搜狗首席技术官杨洪涛表示:“每天搜狗通过输入法,AI硬件、搜索和其他产品为数亿客户提供高质量的产品,如语音、图像、翻译、对话和问答AI我们使用的服务NVIDIATensorRT推理平台实现在线即时快速服务响应,领先AI能力显著提升了我们的客户体验。”

  美团搜索与NLP部长王仲远说:“通过我们领先的生活服务电商平台,美团依托餐饮、外卖、出租车、自行车共享、酒店旅游、电影、娱乐休闲等生活服务,每天为数千万客户提供生活服务NVIDIA推理解决方案,我们只需要4个ms我们可以很好地理解客户的意图,通过搜索、智能助手、智能客户服务等系统,更快地满足用户的生活服务需求,使用最先进的会话AI技术带来了更好的用户体验。”

  递归神经网络变得越来越重要

  TensorRT7加快了AI领域扩展模型。这些模型被用来预测递归循环结构的使用(RNN)时间序列,数据场景。除了会话式AI在语音网络之外,RNN它还可以帮助规划汽车或卫星到达时间,预测电子病历中的异常现象,预测资产和识别欺诈。

  RNN配置和功能组合的爆炸性增长给生产代码带来了挑战,生产代码的快速部署可以满足即时性能标准,这促使开发人员花费近几个月的时间建立手写代码,从而使会话AI只有少数企业拥有必要的专业人才。

  通过TensorRT全球深度学习编译器,来自世界各地的开发人员可以使用这些网络(如定制的自动语音识别网络和文本-语音转换WaveRNN和Tacotron2)实现自动化,实现最佳性能和最低延迟。

  新的编译器也可以在基础上改进transformer例如,用于自然语言处理的模型BERT等。

  从边缘到云,加速推理

  TensorRT7可以快速优化、验证和部署训练有素的神经网络,这是一个超大数据中心,嵌入式或汽车GPU平台提供推理能力。

  NVIDIA包括推理平台TensorRT以及多个NVIDIACUDA-XAI™库和NVIDIAGPU,不只是会话式AI提供低延迟和高吞吐量的推理能力也可以为其他应用提供低延迟和高吞吐量的推理能力,包括图像分类、欺诈识别、分割、目标检测和推荐引擎。该平台的能力已被包括阿里巴巴和美国快递在内的一些世界领先企业和消费技术公司广泛使用(AmericanExpress),百度,PayPal,Pinterest,Snap,腾讯和Twitter。

  供应方式

  TensorRT7将在未来几天开放浏览,用于开发和部署。NVIDIA开发人员计划成员可以通过TensorRT免费获取网页TensorRT7。此外,新版本的插件、语法分析器和样本也将通过开放资源,通过TensorRTGitHub库提供。