科技 > AI的“iPhone 时刻”之后,英伟达新“核弹”将为ChatGPT提速10倍

AI的“iPhone 时刻”之后,英伟达新“核弹”将为ChatGPT提速10倍

2023-03-22 21:10阅读(77)

目前能够实际处理ChatGPT的是英伟达HGX A100,与其相比,目前搭载四对H100与双NVLINK的服务器速度提速10倍之多,成功将语言模型处理成本降低。英伟达推理方面全

1

目前能够实际处理ChatGPT的是英伟达HGX A100,与其相比,目前搭载四对H100与双NVLINK的服务器速度提速10倍之多,成功将语言模型处理成本降低。英伟达推理方面全新的GPU包含4种配置:H100 NVL GPU、L40 GPU、L4 Tensor Core GPU、Grace Hopper超级芯片。这些配置分别用于图像生成加速视频,以及推荐系统大语言模型部署。加速计算并不简单,在2012年计算机视觉模型引发AI技术爆炸,10年之后全新的计算方式是10年前的100万倍,已经迎来崭新的计算平台。

英伟达首席执行官在当地时间三月二十一日,将OpenAI称为人工智能的iPhone时刻,同时在春季大会宣布设计推理GTC。此代英伟达发布了ai超计算服务以及突破等的光刻计算库以及AI云服务。H100 NVL将英伟达的两个 H100 GPU 进行拼接,成功部署大型语言模型。英伟达表示h100NYL附带了超过90GB内存与上代相比,h100综合技术创新将大型语言模型速度提高30倍以上,并透露H100NYL预计在2023年下半年上市。

第2款芯片用于AI Video,视频讲解方面进行优化,也在视频通话以及视频内容审核中提升并优化,英伟达称第2款芯片可以提供比CPU高100多倍的AI性能。也就是一台8-GPU L4服务器会取代100多台处理AI视频的CPU服务器。

黄仁勋说谷歌目前是第1家提供l4视频芯片的供应商,目前是私人预览版,l4即将在谷歌Vertex AI模型商店上架,除谷歌产品外,l4在其他30多家计算机制造商的系统中提供,其中包含华硕戴尔科技华研,惠普企业,联想,富士通等企业。与此同时,英伟达针对图形渲染以及文本转视频图像等生成,AI推出了l40芯片,其性能目前是英伟达最受欢迎云推理系统的10倍。英伟达在此之外,推出了全新超级芯片,适用于大型语言模型以及推荐系统等。全新的计算技术为计算机领域推动新的台阶,带来了新领域的转型,迎接全新的计算平台。