推理芯片蓄势待发,瀚博半导体发布首款高性能超低延时通用云端推理AI芯片 | WAIC 2021

IM2Maker 3年前 (2021-07-07)

瀚博半导体于今日在2021世界人工智能大会期间发布其首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡。

今年上半年国家发布“十四五规划”,特别指出要“瞄准人工智能、量子信息、集成电路等前沿领域。作为新一轮产业变革的核心驱动力,人工智能相关技术和应用正呈现快速发展的趋势。

聚焦到人工智能芯片,数据显示,2021年开始,数据中心对于人工智能推理芯片的需求逐渐超越对于训练芯片的需求,整个推理市场蓄势待发。而且,随着模型训练逐渐成熟,AI应用逐渐落地,市场差距还会越来越大。

在此背景之下,瀚博半导体于今日在2021世界人工智能大会期间发布其首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡,可实现深度学习应用超高性能超低延时的推理性能,可显著降低数据中心与边缘智能应用的部署成本。

云端通用AI推理芯片SV100系列

据介绍,此次发布的瀚博SV100系列芯片,单芯片INT8峰值算力超200 TOPS,深度学习推理性能指标数倍于现有主流数据中心GPU,具有超高吞吐率、超低延时的特性。

SV100系列芯片支持FP16, BF16和INT8等数据格式,并可以实现众多主流神经网络的快速部署及计算机视觉、视频处理、自然语言处理和搜索推荐等多样化推理应用场景。

同时集成高达64路以上H.264/H.265/AVS2的1080p视频解码,广泛适用于云端与边缘智能应用场景,提升客户的设备资产效益、降低运营成本。

VA1推理加速卡

与此同时,瀚博同步推出的基于SV100系列芯片的VA1推理加速卡,为单宽半高半长75瓦PCIe x16卡,支持32GB内存和PCIe 4.0高速接口协议,无需额外供电,即可适用于所有厂商的人工智能服务器,实现数据中心高密度高算力部署。

关于为什么要聚焦于视频方向,瀚博半导体创始人兼CEO钱军表示:“计算机视觉占了AI市场的大半壁的江山,视频流占整个数据流的70%,对于视频提供的庞大数据,需要强大的AI算力支持。”

如何判断AI的性能?可以从LTE三个方面来看,分别是指Latency延时、Throughput吞吐量和Energy Efficiency低功耗。

对此,钱军表示:“瀚博通过前期核心技术积累和前瞻性布局,正式发布我们性能优异的SV100系列云端通用AI推理芯片和VA1推理卡,可有效应对低延时、通用性和视频处理等方面的行业痛点,推进云端与边缘的智能应用落地。”

据悉,SV100系列及VA1通用推理加速卡预计将于今年四季度量产上市。

关于瀚博半导体

瀚博半导体2018年12月成立于上海,在北京、深圳和多伦多均有研发分部。公司核心员工来自世界顶级的高科技公司,平均拥有15年以上的相关芯片与软件设计经验。公司目前拥有200人以上的资深团队,且规模还在快速增长中。瀚博半导体致力于成为驱动云边计算的算力源泉、中国芯片设计企业的标杆和世界芯片设计的领导者之一。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到