11月14日消息,昨日,安謀科技正式發(fā)布了專為端側(cè)大模型而生的最新一代NPU IP——“周易”X3,其能夠與Arm架構(gòu)CPU、GPU協(xié)同,組成基于Arm生態(tài)的異構(gòu)算力解決方案。

總體來(lái)看,今天發(fā)布的“周易”X3在模型支持、硬件架構(gòu)、軟件生態(tài)、算力帶寬、能效面效、擴(kuò)展性和系統(tǒng)一致性等多方面進(jìn)行了重點(diǎn)升級(jí)。
安謀科技產(chǎn)品研發(fā)副總裁劉浩提到,在安謀科技看來(lái),“周易”NPU團(tuán)隊(duì)是驅(qū)動(dòng)創(chuàng)新的核心引擎,NPU也一直是安謀科技的戰(zhàn)略核心產(chǎn)品。
從2018年開(kāi)始,安謀科技就組建了國(guó)內(nèi)最早的NPU研發(fā)團(tuán)隊(duì)之一,目前已經(jīng)交付了5代NPU,并實(shí)現(xiàn)了在終端領(lǐng)域的商業(yè)落地,據(jù)稱“周易”NPU的研發(fā)和支持100%來(lái)自中國(guó)本土團(tuán)隊(duì)。
劉浩提到,今天端側(cè)需要的不是單純的算力堆疊,而是效率優(yōu)先,一個(gè)系統(tǒng)性的、全局優(yōu)化的算力底座。
一、軟硬件深度協(xié)同,“周易”X3多點(diǎn)創(chuàng)新
具體來(lái)看此次發(fā)布的“周易”X3,其采用了最新的DSP+DSA架構(gòu),從定點(diǎn)轉(zhuǎn)向浮點(diǎn)計(jì)算,其最核心的特點(diǎn)是通用、靈活、高效、軟硬件緊密協(xié)同的計(jì)算架構(gòu)。

新的“周易”X3 NPU IP可以兼顧傳統(tǒng)CNN架構(gòu)與當(dāng)下主流的Transformer架構(gòu),硬件架構(gòu)方面,周易X3單Cluster算力可以支持8-80TFLOPS(FP8),單核心帶寬最高為256GB/s。
此外,“周易”X3采用了AI專屬硬件引擎AIFF,配合專用硬化調(diào)度器,可以實(shí)現(xiàn)低至0.5%的CPU負(fù)載和低調(diào)度延遲。

軟件生態(tài)方面,Compass AI軟件平臺(tái)可以提供統(tǒng)一的端到端工具鏈支持全系列“周易”NPU。
目前Compass AI軟件平臺(tái)已經(jīng)兼容了TensorFlow、ONNX、Pytorch等主流AI框架,支持大模型動(dòng)態(tài)Shape能力,同時(shí)支持GPTQ等大模型主流量化方案、Hugging Face模型庫(kù),以及LLM、VLM、VLA、MoE等多種類型的模型。

在模型支持方面,“周易”X3支持的算子數(shù)量超過(guò)160個(gè)、支持的模型數(shù)量超過(guò)270個(gè)。
實(shí)際性能表現(xiàn)方面,其CNN模型性能相較上一代提升了30-50%,在相同算力規(guī)格下,AIGC大模型能力提升了10倍左右,多核算力線性度可以達(dá)到70-80%,大模型Prefill階段算力利用率提升至72%,Decode階段有效帶寬利用率在開(kāi)啟安謀科技自研的解壓引擎WDC情況下超過(guò)100%。
二、AI PC端側(cè)AI能力暴漲,“周易”全家桶應(yīng)用案例集中展示
此次在發(fā)布會(huì)現(xiàn)場(chǎng)的Demo展區(qū),我們看到基于“周易”NPU IP實(shí)現(xiàn)的諸多場(chǎng)景化落地解決方案。

比如在當(dāng)下業(yè)內(nèi)大火的AI視覺(jué)識(shí)物、AI讀懂世界方面,基于“周易”X3,AI PC本地運(yùn)行MinicpM v2.6模型,可以實(shí)現(xiàn)隨時(shí)拍照隨時(shí)識(shí)圖,AI快速圖解各類事物。
在經(jīng)典的文生圖應(yīng)用方面,基于“周易”X3,AI PC本地運(yùn)行Stable Diffusion v1.5,可以實(shí)現(xiàn)流暢高質(zhì)量的端側(cè)文生圖,從演示案例來(lái)看,圖片的清晰度不錯(cuò),同時(shí)生成速度僅為“秒級(jí)”,AI可以幫助創(chuàng)作者更高效地將創(chuàng)意想法變?yōu)楝F(xiàn)實(shí)。

在基礎(chǔ)的文生文應(yīng)用中,我們看到“周易”X3可以支持端側(cè)運(yùn)行DeepSeek-R1-Distill-Qwen-1.5B,AI對(duì)話的流暢度、tokens生成速度都有比較明顯的提升。
整體來(lái)看,相比前代產(chǎn)品,X3在性能方面的大幅提升以及生態(tài)方面的出色支持,帶來(lái)的最直觀效果就是AI應(yīng)用實(shí)際體驗(yàn)的流暢度大幅提升。
據(jù)了解,從加速卡、AI PC、AI手機(jī)、具身智能、智能座艙、ADAS(高級(jí)駕駛輔助系統(tǒng))到智能IPC等終端,“周易”X3 NPU IP已經(jīng)可以覆蓋基礎(chǔ)設(shè)施、智能汽車、移動(dòng)終端、智能物聯(lián)等領(lǐng)域。
結(jié)語(yǔ):All in AI的安謀,手握軟硬技術(shù)生態(tài),加速本土端側(cè)AI落地
長(zhǎng)期以來(lái),安謀科技專注于核心IP設(shè)計(jì),針對(duì)AI技術(shù)趨勢(shì)前瞻布局,可以很好的解決客戶自研AI芯片的痛點(diǎn)。
安謀科技當(dāng)前的戰(zhàn)略發(fā)展方向是“AI Arm China”,也就是全力All in AI。具體來(lái)看,安謀科技會(huì)提供NPU IP、開(kāi)放合作、提供完整解決方案。
未來(lái)兩年內(nèi),安謀科技會(huì)發(fā)布更多的NPU產(chǎn)品,我們也期待在端側(cè)AI爆發(fā)的未來(lái),安謀科技能夠在技術(shù)和生態(tài)上帶給行業(yè)更多驚喜。