人工智能计算中间是扶植新一代人工智能家当集群的关键基本举措措施。近年来,我国多个中间城市加快推动人工智能家当构造,以期在新一轮科技革命的机会之中抢占成长先机,而搭建集约化、一体式人工智能计算中间也就成为了各地新基建蓝图中的重大年夜工程。
众所周知,算力、算法、数据是人工智能的三驾马车。假如没有算力的支撑,人工智能将难以走向应用普及。是以,在人工智能计算中间扶植高潮中,将数据和算法调和起来的AI芯片便成为最受存眷的模块。
当前,各行各业对适配AI模型的练习需求呈爆发式增长,而一个高质量的AI模型是经由过程练习和持续迭代优化而来的。昔时夜模型、多模态算法模型练习逐渐成为主流,人工智能算力需求每3.5个月就翻一番,企业在AI研发中进行模型练习的算力成本居高不下。是以,可否为企业和科研机构供给可持续、高适配、高弹性的练习算力成为衡量各地人工智能计算中间“含金量”的核心指标。假如没有技巧足够成熟的练习芯片来供给练习算力保障,就难以保障平台产出算法模型的效力,那么以亿为成本而扶植的人工智能计算中间也就成了“雷声大年夜雨点小”的空壳工程。
在实际的人工智能计算中间硬件构造中,芯片重要适配于推理和练习两大年夜场景。练习芯片和推理芯片之间的逻辑差别可以懂得为:练习芯片像师长教师,一遍一遍教一个完全不认字的小孩从零开端识字,一遍不会就再教一遍,直到教会为止;而推理芯片则是已经学会识字的小孩,浏览不合的书本时,可以辨认出版本中的字。
换句话说,练习是从现有的数据中进修新的才能,而推理则是将已经练习好的才能应用到实际场景中。分开了练习的推理,就相当于空中楼阁。所以,相较于推理芯片,练习芯片是人工智能赓续进化的基本,也是浩瀚AI芯片厂商须要出力霸占的研发高地。
那么,与推理芯片比拟,练习芯片在技巧上具有哪些特点?
起首,练习芯片具备浮点运算才能。复杂模型的练习过程中,需经由过程精细的浮点表达才能对上千亿个浮点参数进行微调数十万步。无浮点运算才能的芯片如用于练习将增长约40%的额外操作,以及至少4倍的内存读写次数。
其次,练习芯片具有专用AI加快单位,并具有高能效比的特点。当前有个别厂商采取2016年国外品牌GPU架构,缺乏AI加快单位,导致其AI练习能效比差,且能耗剧增。与之比拟,设备矩阵加快单位的练习芯片可使AI练习效力晋升10倍。
为AI家当供给充分算力,须要在AI处理器硬件上有扎实的技巧积聚。据懂得,今朝很多人工智能计算中间应用的由昇腾910AI练习处理器,原生具备练习才能,集群机能业界领先。今朝,该集群可以在28秒完成基于Resnet-50模型练习(持续保持业界第一),并且机能还将持续晋升。同样,基于昇腾AI基本软硬件平台的“鹏城云脑II”荣获AIPerf(世界人工智能算力)第一名,并再次刷新IO500(高机能计算存储体系机能排行榜-全体系输入输出和10节点体系)两项世界冠军。
跟着主动驾驶、生物信息辨认、机械人、主动巡检等人工智能终端产品和应用越来越广泛化,人工智能家当集群的价值弗成估计。在从理论走向应用的家当化过程中,练习芯片作为算力平台的“心脏”,其市场也持续蓬勃成长。
研究机构赛迪参谋宣布的申报显示,从2019年到2021年,中国云端练习AI芯片市场累计增长了约127%。2021年,云端练习芯片市场范围将达到139.3亿元。据猜测,从2019年到2024年,云端练习芯片的年复合增长率或达到32%。
以全国第一小我工智能计算中间——武汉人工智能计算中间为例,其一期扶植范围为100P FLOPS AI算力,本年5月31投运当天年力负载便达到了90%,投运之后持续满负荷运行。如今,武汉人工智能计算中间仍在持续扩容中。9月初正式上线的西安将来人工智能计算中间一期筹划300PFLOPSFP16(每秒30亿亿次半精度浮点计算)计算才能。作为西北地区首个大年夜范围人工智能算力集群,其算力平台承载力达到了当下我国同类平台中的领先的程度。
市场的高速增长预示着,当人工智能成长到深水区阶段,各行各业对AI练习算力的需求将经久保持几何级增长。而练习芯片作为练习算力的引擎,也是人工智能模型练习的“基本中的基本”,也将作为人工智能计算中间的魂魄获得更广泛的看重。信赖,在我国极为丰富的AI应用生态优势引领下,无论是练习芯片照样推理芯片,都将获得更为长足的快速成长。
进入购买