簡要描述:寒武紀(jì)AI加速卡可適配國產(chǎn)平臺采用思元370芯片,是寒武紀(jì)使用chiplet(芯粒)技術(shù)的人工智能芯片,采用寒武紀(jì)新一代人工智能芯片架構(gòu)-MLUarch03,7nm制程集成高達(dá)390億晶體管。支持LPDDR5內(nèi)存,內(nèi)存帶寬是上一代產(chǎn)品的3倍,集成了強(qiáng)大的媒體性能,可支持132路1080p視頻解碼或10路8K視頻解碼。
產(chǎn)品目錄Product center
相關(guān)文章Related articles
相關(guān)新聞Related News
品牌 | 其他品牌 | AI加速卡 | 1080P |
---|---|---|---|
品牌 | 寒武紀(jì) | 功能 | AI加速 |
接口 | PCI-E |
寒武紀(jì)AI加速卡可適配國產(chǎn)平臺寒武紀(jì)堅(jiān)持自研智能芯片架構(gòu)和指令集。新一代智能處理器架構(gòu)MLUarch03,擁有新一代張量運(yùn)算單元,新增FP32,FP16,BF16運(yùn)算類型;片上通訊帶寬是上一代MLUarch02的2倍、片上共享緩存容量最高是MLUarch02的275倍;內(nèi)置專用模塊大幅提升各類卷積效率,減少算子執(zhí)行時間;推出全新MLUv03指令集,更完備,更高效且向前兼容。
MLU370-S4加速卡支持PCle Gen4,功耗僅為75W,在2U標(biāo)準(zhǔn)服務(wù)器機(jī)箱里可支持高達(dá)8卡的高密度部署。
寒武紀(jì)AI加速卡可適配國產(chǎn)平臺可廣泛支持視覺、語音、自然語言處理等高度多樣化的人工智能應(yīng)用,幫助AI推理平臺實(shí)現(xiàn)超高密度。
同時,寒武紀(jì)全新升級了Cambricon Neuware 軟件棧,新增推理加速引擎MagicMind,實(shí)現(xiàn)訓(xùn)推一體,大幅提升了開發(fā)部署的效率,降低用戶的學(xué)習(xí)成本、開發(fā)成本和運(yùn)營成本。
370采用chiplet(芯粒)技術(shù),在一顆芯片中封裝2顆AI計(jì)算芯粒(MLU-Die),每一個MLU-Die具備獨(dú)立的AI計(jì)算單元、內(nèi)存、10以及MLU-Fabric控制和接口,通過MLU-Fabric保證兩個MLU-Die間的高速通訊,可以通過不同MLU-Die組合規(guī)格多樣化的產(chǎn)品,為用戶提供適用不同場景的高性價比AI芯片。
寒武紀(jì)堅(jiān)持自研智能芯片架構(gòu)和指令集。新一代智能處理器架構(gòu)MLUarch03,擁有新一代張量運(yùn)算單元,新增FP32,FP16,BF16運(yùn)算類型;片上通訊帶寬是上一代MLUarch02的2倍、片上共享緩存容量最高是MLUarch02的275倍;內(nèi)置專用模塊大幅提升各類卷積效率,減少算子執(zhí)行時間;推出全新MLUv03指令集,更完備,更高效且向前兼容。
思元370升級了視頻圖像編解碼單元,可提供更高效的視頻處理能力和更優(yōu)的編碼質(zhì)量,支持更復(fù)雜、更繁重、低延時要求的計(jì)算機(jī)視覺任務(wù)。解碼方面,思元370集成了強(qiáng)大的媒體性能,可支持132路1080p視頻解碼或10路8K視頻解碼。編碼方面,全新編碼器通過靈活的碼率優(yōu)化(RDO) 控制、多參考、二次編碼等特性組合,在相同圖像質(zhì)量(全高清視頻PSNR)的情況下比上一代產(chǎn)品節(jié)省42%帶寬,有效降低帶寬成本。
全新推理加速引擎MagicMind
MagicMind是寒武紀(jì)全新打造的推理加速引擎,也是業(yè)界基于MLIR圖編譯技術(shù)達(dá)到商業(yè)化部署能力的推理引擎。MagicMind支持跨框架的模型解析、自動后端代碼生成及優(yōu)化,用MLU、GPU、CPU訓(xùn)練好的算法模型,借助MagicMind,用戶僅需投入極少的開發(fā)成本,即可將推理業(yè)務(wù)部署到寒武紀(jì)全系列產(chǎn)品上,并獲得頗具競爭力的性能。
掃一掃 微信咨詢
©2024 晶創(chuàng)越世科技(北京)有限公司 版權(quán)所有 備案號:京ICP備11014289號-1 技術(shù)支持:智能制造網(wǎng) Sitemap.xml 總訪問量:951131 管理登陸