轉(zhuǎn)載請注明以下內(nèi)容:
來源 :公眾號【網(wǎng)絡(luò)技術(shù)干貨圈】
作者 :圈圈
ID :wljsghq
在當(dāng)今的計算世界里,有三位“武將”幾乎無處不在:
? CPU —— 通用型的“大腦”,幾乎任何計算任務(wù)都能接。 ? GPU —— 圖形和并行計算的“多核猛將”,擅長“人海戰(zhàn)術(shù)”。 ? NPU —— 人工智能領(lǐng)域的新銳,專為神經(jīng)網(wǎng)絡(luò)而生。 ?它們的出現(xiàn)并不是一蹴而就的,而是隨著計算需求的變化逐漸形成的分工體系。想要看懂它們的差異,我們需要先從各自的“家世背景”說起。
CPU "
計算機世界的中樞神經(jīng)
CPU(Central Processing Unit,中央處理器)是計算機的核心控制和運算單元,就像整臺計算機的“指揮官”,負(fù)責(zé)執(zhí)行指令、調(diào)度資源、協(xié)調(diào)各個硬件模塊的運作。
架構(gòu)特點 ? 通用性強 :幾乎所有類型的計算任務(wù)都能執(zhí)行。 ? 核心數(shù)量有限 :現(xiàn)代桌面級 CPU 一般在 4~16 核,服務(wù)器級可達(dá)數(shù)十核,但遠(yuǎn)不及 GPU 核心數(shù)。 ? 高主頻 :常見 3GHz 左右,單核性能強大,延遲低。 ? 復(fù)雜指令集 :支持分支預(yù)測、亂序執(zhí)行、流水線等優(yōu)化技術(shù)。 典型應(yīng)用 ? 系統(tǒng)管理任務(wù)(操作系統(tǒng)調(diào)度、進(jìn)程管理) ? 單線程性能要求高的任務(wù)(如部分游戲邏輯、數(shù)據(jù)庫事務(wù)處理) 優(yōu)勢與劣勢 ? 劣勢 :在需要極端并行計算的場景下效率不如 GPU/NPU GPU "
并行計算的多核戰(zhàn)士
GPU(Graphics Processing Unit,圖形處理器)最早是為圖形渲染而生,用于處理 3D 圖形的矩陣和向量運算。隨著 CUDA、OpenCL 等并行計算框架出現(xiàn),GPU 的用途擴展到科學(xué)計算、機器學(xué)習(xí)等領(lǐng)域。
架構(gòu)特點 ? 核心數(shù)極多 :動輒數(shù)千上萬的運算核心(如 NVIDIA RTX 4090 擁有 16384 個 CUDA 核心) ? 擅長大規(guī)模并行 :適合批量數(shù)據(jù)的矩陣、向量運算 ? 吞吐量高 :總計算能力可達(dá)數(shù)百 TFLOPS ? 存儲延遲相對高 :不適合分支復(fù)雜、需要頻繁訪問內(nèi)存的小任務(wù) 典型應(yīng)用 ? 深度學(xué)習(xí)訓(xùn)練(矩陣運算是神經(jīng)網(wǎng)絡(luò)訓(xùn)練的核心) ? 科學(xué)計算(天氣模擬、分子建模、天文數(shù)據(jù)分析) 優(yōu)勢與劣勢 ? 優(yōu)勢 :大規(guī)模并行計算能力極強,吞吐量高 ? 劣勢 :對通用計算任務(wù)的靈活性不如 CPU,延遲高 NPU "
AI 時代的“神經(jīng)元”加速器
NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理器)是專為深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)推理優(yōu)化的處理器。它的設(shè)計目標(biāo)是以最高效率執(zhí)行卷積、矩陣乘法等 AI 常用運算。
架構(gòu)特點 ? 面向張量計算 :優(yōu)化卷積、矩陣乘法、激活函數(shù)等核心運算 ? 片上存儲優(yōu)化 :減少外部內(nèi)存訪問延遲 典型應(yīng)用 ? AI 推理(圖像識別、語音識別、自然語言處理) 優(yōu)勢與劣勢 ? 優(yōu)勢 :AI 推理性能極高,功耗低,延遲小 ? 劣勢 :專用性強,通用計算能力弱,不適合非 AI 運算 三者對比
該文章在 2025/8/12 10:46:30 編輯過