顯示具有 機器視覺 標籤的文章。 顯示所有文章
顯示具有 機器視覺 標籤的文章。 顯示所有文章

2026年3月21日 星期六

運算架構大解密 (五):神經處理單元 (NPU) — 突破記憶體牆的邊緣 AI 加速器

運算架構大解密 (五):神經處理單元 (NPU) — 突破記憶體牆的邊緣 AI 加速器

(本篇為系列文章第五篇。如果您還沒看過前一篇關於硬體重構與空間運算的文章,建議先閱讀:運算架構大解密 (四):現場可程式化邏輯閘陣列 (FPGA) — 空間運算與硬體的終極變色龍

在上一篇文章中,我們認識了 FPGA 這種能夠隨心所欲改變硬體電路型態的「變色龍」晶片。然而,當科技發展進入人工智慧(AI)與深度學習的爆發期,我們面對的是幾何級數增長、動輒數百萬甚至上億次的神經網路矩陣運算。在這樣的極端負載下,通用型 CPU 顯得無力,而圖形處理器(GPU)雖然算力驚人,卻伴隨著巨大的功耗,無法塞進手機或無人機等依靠電池運作的設備中。為了解決這個矛盾,專為邊緣運算量身打造的神經處理單元(Neural Processing Unit, 簡稱 NPU)應運而生。

一、AI 運算的致命傷:撞上「記憶體牆」

要理解 NPU 存在的必要性,我們必須先看見傳統架構在執行 AI 運算時的根本痛點:記憶體牆(Memory Wall)

什麼是記憶體牆?
在神經網路的推論過程中,需要頻繁地讀取龐大的「權重(Weights)」與「特徵圖(Feature Maps)」。研究指出,在傳統的馮紐曼架構下,高達 80% 到 90% 的能源並非消耗在「運算(乘加操作)」本身,而是浪費在「將資料從外部記憶體(DRAM)搬運到晶片內部」的傳輸過程中。

想像一下,為了解決一道簡單的數學題,您花費了 1 分鐘思考,卻花了 9 分鐘走到圖書館拿參考書。這就是 CPU 與 GPU 在處理邊緣 AI 任務時面臨的窘境。高昂的資料搬運功耗,直接扼殺了將複雜 AI 模型部署在低功耗設備上的可能性。




二、NPU 的破壁絕招:空間資料流架構 (Dataflow Architecture)

NPU 如何打破這面高聳的記憶體牆?它的核心武器是「空間資料流架構(Dataflow Architecture)」。與我們在上一篇提到的 FPGA 類似,NPU 也採用了空間運算的概念,但它是為了「矩陣乘加」這項單一任務而徹底固化的特製硬體。

  • 最大化晶片內部的資料重複利用率: NPU 內部佈滿了由乘加器(MAC)組成的巨大處理陣列,並且緊密結合了分散式的本地靜態記憶體(SRAM)。
  • 權重複用 (Weight Reuse): NPU 的資料流控制機制會將神經網路的權重載入到乘加器陣列中並「停留」在那裡。當連續的影像特徵資料如同流水般通過這些乘加器時,就不需要為了每一次運算重新去外部 DRAM 讀取相同的權重。
  • 透過這種巧妙的資料排程,NPU 將外部記憶體存取的頻率降到了最低,從根本上解決了功耗問題。

三、硬體電路固化:極致能效比的秘密

除了打破記憶體牆,NPU 還在硬體層面上進行了「斷捨離」。在 NPU 眼中,神經網路模型就是一堆矩陣乘法、加法,以及非線性啟動函數的組合。

因此,NPU 放棄了 CPU 內部為了處理複雜作業系統而設計的控制邏輯(如分支預測、亂序執行)。相反地,NPU 直接將神經網路中常見的數學操作,例如 ReLU 啟動函數(Activation Functions)池化層(Pooling),直接燒錄成了專屬的「硬體電路」。

這種毫不妥協的特定領域架構設計,讓 NPU 能夠在毫瓦(mW)至 15 瓦(W)的極低功耗信封內,提供驚人的每秒兆次運算能力(TOPS),實現了極致的能效比。

四、NPU 在邊緣運算的實務應用

今日,NPU 已經悄悄地潛入我們生活的各個角落,成為了「邊緣 AI(Edge AI)」的中樞神經:

  1. 智慧型手機: 現代手機 SoC(如 Apple A 系列、Snapdragon)內建的 NPU 負責了極其複雜的計算攝影(如即時夜景降噪、人像景深運算),以及完全斷網下的本地端自然語言處理與語音辨識。
  2. 無人機與自駕車系統: 在高速移動的環境中,無人機必須依賴 NPU 在幾毫秒內處理多鏡頭影像,進行即時的深度估計與避障,因為將資料傳上雲端再等指令傳回,早已經來不及了。
  3. 工業機器視覺: 工廠流水線上的高速瑕疵檢測系統,利用 NPU 可以在不外接龐大耗電 GPU 主機的情況下,直接在攝影機終端(Smart Camera)完成推論。這不僅解決了頻寬限制,也保護了工廠的生產資料隱私。


結語

神經處理單元(NPU)透過「資料流架構」與「特定硬體固化」,完美解決了邊緣運算設備在處理 AI 推論時的功耗與記憶體存取瓶頸。然而,當我們將目光從「終端邊緣設備」轉向「雲端資料中心」,當面臨的是包含數千億參數的巨型大型語言模型(LLM)的訓練任務時,即便 NPU 也顯得微不足道。在下一篇文章中,我們將直擊 AI 運算的最頂點:一窺 Google 為雲端打造的脈動陣列巨獸 —— 張量處理單元(TPU)

2024年4月11日 星期四

為什麼你的PLC定位會不準? 精密定位精度的關鍵因素

 精密定位機構包含多個關鍵元件。定位精度的需求多樣化,涉及多種功能和精度,因此選擇合適的組件組合尤為重要。選擇的依據不僅是元件的優劣,而是其是否能滿足特定功能和精度的要求。


此外,控制驅動裝置在提升定位系統精度中扮演著至關重要的角色。提升系統精度不僅需要提高個別元件的性能,更重要的是對整個系統進行全面優化和設計。


傳動機構中,傳送螺桿是最常使用的元件之一。其精度覆蓋範圍廣泛,從經濟型螺絲到高精度的方形螺桿和靜壓螺桿等不等。


在精確定位的應用中,壓電元件、線性馬達等直驅或摩擦驅動裝置有多個實用例子。儘管市場上存在多種傳動機構元件,但在選擇時需考慮成本、長期穩定性、行程、剛性、負載能力和速度的平衡,以及控制的難易程度和使用便捷性。在這些因素中,滾珠螺桿因其多項特性而被廣泛應用。


導引機構也依賴於各種元件,其中動壓導引是最常見的形式。然而,在當前對高精度和高速度的要求下,靜壓導引和滾動導引的應用也在增加,這是因為它們能夠減少遊隙、摩擦力變化、低速時的粘滑現象及高速運行的耐久性問題。此外,在特定環境下,如真空條件中,磁力懸浮導引的應用也逐漸變得實用。


2017年8月21日 星期一

機器視覺(視覺系統)-簡單介紹3-光源的架設

前兩篇介紹了:機器視覺的基礎 及 認識影像

機器視覺(視覺系統)-簡單介紹
https://vkinngworld.blogspot.tw/2017/08/blog-post.html
機器視覺(視覺系統)-簡單介紹2-認識影像
https://vkinngworld.blogspot.tw/2017/08/2.html

光源的架設可以說決定了,機器視覺的檢測率,也不為過。


本篇要介紹幾種架設光源的方式:

======以下資料取自台達DMV手冊===========================

1.暗場打光(Dark field lighting): 平滑處影像較暗 
CCD 攝影機與鏡頭配置未於同軸狀態,且彼此夾角非直角情形。利用物體表面的不平滑區散射情形而取得影像光線,
而物體平滑區域會產生直角反射而造成光線未進入 CCD,因此平滑面區域影像較暗,而不平滑區域則較亮。










2017年8月14日 星期一

機器視覺(視覺系統)-簡單介紹2-認識影像

上一篇當中提到一些機器視覺的基本。https://vkinngworld.blogspot.tw/2017/08/blog-post.html

本篇要介紹的是,在機器視覺的系統當中,是如何處理這些影像。
了解到影像的處理,才有辨法提供好的影像,提升辨識率。

從人眼看到影像是彩色的,我們可以形容是類比。
而CCD(相機)擷取後,是需要轉換成數位信號,才有辨法做傳輸/儲存/辨別。

如果是以黑白機器視覺來說,
每個像素,會變成0(黑)-255(白)之間的一個值。
依照順序排列。

左邊的第一幅是原始的彩色照片。
中間的一幅是灰階圖像,所有的顏色用黑色、白色以及不同的灰階表示。
右邊的圖片是黑白即單色圖像,圖片中只有黑色與白色而沒有中間顏色。


下圖是將彩色轉成灰階後的數值表示:

2017年8月7日 星期一

機器視覺(視覺系統)-簡單介紹


1.
機器視覺,主要是用來取代人力,做品檢的工作,
可以避免人員因為疲累或心情,而導致不良品產出。
所以得知有良品及公差,才知道好壞。

「建立標準品圖樣」<<工作1

就像大家來找碴一樣,有正確圖,及錯誤圖,
來利用機器視覺來找出錯誤點。

2.
因為是採用攝影機來做取像的動作。
所以光源很重要。
就像人眼,在光眼不足的地方,需要適應一樣,
如果光源不穩定,就容易產生誤差,誤判。

「光源」<<工作2

控制環境光,或是製造比環境光強的光(閃光燈)

3.
攝影機跟產線上的被檢測產品之間的距離,
通常是固定,所以焦距也是固定,而鏡頭就是扮演調焦的角色。

「鏡頭的選用」<<工作3

4
攝影機的解析度.代表者對產品檢測的最小精度。

例:
200萬畫素=1600x1200 畫素
拍攝的範圍為16mmx12mm
所以每個畫素=10umx10um

如果要檢查的精度是5um,那顯然就不合適。
「攝影機的選用」<<工作4
「拍攝範圍的選擇」<<工作5

2015年2月6日 星期五

工業相機 和 一般相機有什麼不同


在機器視覺快速發展的今天,
工業相機做為機器視覺的核心組件已經得到廣泛的應用,
但是很多初學者還是搞不清楚究竟工業用相機與我們平常所使用的數位相機有何區別。

1.工業用相機快門時間非常短,可以拍快速運動的物體。
例:把名片貼在電風扇葉片上,以最大速度旋轉,然後用工業相機抓拍一張圖,
仍可以清辨別名片上的字體。用一般相機來拍攝是不可能達到這樣的效果。

2.感光元件是逐行掃描的,而一般相機的感光元件是隔行掃描,
有些甚至是隔三行掃描的。
逐行掃描的感光元件比產比較困難,良率低,出貨量也少。
世界上只有少數幾個公司能夠提供這類的產品,
例:Dalsa、Sony。而且價格昴貴。
百萬相素逐行掃描的感光元件CCD的價格,從幾萬元,到幾十萬元不等。

3.拍攝速度遠高於一般相機
工業相機每秒可以拍攝十張到幾百張的圖片,
而一般相機只能拍攝2-3張,相差太多。(一般相機多了高速取像,也是有限制的的

4.輸出的是裸數據(RAW DATA),其光譜範圍也往往比較寬,
比較適合進行高質量的影像處理算法。

5.可提供二次開發包,也就是工業相機的源代碼,
方便客戶進行二次開發,方便嵌入自已的程式中。

6.長時間工作穩定性高,工業相機的元件選擇要求高,生產技術要求嚴格,
一般可適應惡劣環境下工作,7*24小時長時間工作不會出現問題。

以上六大特點就可以看出工業相機與一般數位相機的不同之處,
當然工業相機的優勢也不是從以上幾點就可以完全表達,
需要自身去使用,才會了解。