Avnet Asia Connect

你能“看見”的，比你看見的多得多！

今天除了人類自己的眼睛，還有越來越多的“機器之眼”在說明我們觀察、記錄和分析著周遭的這個世界，讓我們實際的視覺能力大為擴展和增強。目前在中國，由公安引導安裝的監控攝像機就超過了2000萬台，一個月的資料流程量達7500PB。再考慮到那些家庭和個人安裝的監控攝像頭，我們愛車上倒車影像、行車記錄儀等視覺傳感裝置，以及GoPro這種拉風的消費級數碼視覺單品……不知不覺中，我們已經置身於一個機器視覺的汪洋大海中。

顧名思義，機器視覺的核心價值，就是代替人眼和人腦對圖像和視頻資訊作出感知和分析判斷。雖然機器視覺不算一個新概念，卻在過去的10年中獲得了高速的發展，且在可以預見的未來仍然保持相當的加速度。機器視覺這樣一種發展態勢，得益於三個因素。

第一個因素就是摩爾定律。從硬體的角度來看，一個機器視覺系統包含兩個核心的器件：一個是CMOS圖像感測器（攝像頭），一個是處理器。而這兩者都是可以通過標準CMOS半導體工藝製造的，因此也就被套上了摩爾定律的的“魔咒”，在似乎永無止境的追求“三低一高”(低功耗、低成本、小尺寸、高性能)的征途上一路狂奔，不斷拉低機器視覺的獲取成本。想一想今天一個入門級手機攝像頭的解析度，可能和幾年前中高端單反相機圖像感測器的級別相當，這恐怕就是用戶對摩爾定律作用最直觀的感受了。

摩爾定律同樣在推動處理器性能的提升，使其完全可以勝任複雜的影像處理計算。在處理器硬體架構的選擇上，今天機器視覺的開發者有多種選擇：可以選擇專門為影像處理優化的DSP；也可以選擇採用ARM+GPU或其他圖像輔助處理器的平臺；還有基於ARM+FPGA可程式設計邏輯的異構處理架構（如Xilinx Zynq 7000）可供使用。即使是主流的ARM通用處理器平臺，配合優化的軟體演算法，同樣可以在很多機器視覺應用中施展拳腳。想要獲得性價比更高的機器視覺處理器，對使用者來說只是一個時間問題。

推動機器視覺快速發展的第二個因素，就是日益豐富的演算法和軟體資源。可以說被摩爾定律“綁架”了的硬體降低了機器視覺的使用門檻，但想真正讓機器像“人眼+人腦”一樣運轉起來，甚至更高能和高效地運轉，就必須要有軟體的配合。在上個世紀，做機器視覺的演算法和軟體，絕對是一個燒腦的工作，公司裡沒有幾個Ph.D是不敢開張的。這樣的局面從2000年起發生了改變——那一年Intel發佈了OpenCV，這是一個基於BSD許可的開源跨平臺電腦視覺庫，開發者通過一系列C/C++函數可以方便地實現很多圖像和視覺處理方面的通用演算法。從那時起，基於不斷更新的OpenCV庫，演化出了為不同機器視覺應用而優化的功能和演算法，且更容易在嵌入式處理器中移植和運行，由此逐漸形成了完備的機器視覺軟體生態系統。與此同時，很多商業版的軟體發展工具也開始將視覺處理功能集成在其中，令機器視覺的應用開發更加觸手可及。

圖1，Avnet提供的Blackfin嵌入式視覺學習開發套件，包括完整的硬體和軟體資源，可以説明機器視覺開發者快速上手

可以說，硬體和軟體生態環境的成熟，造就了過去十年機器視覺版圖的快速擴張。而接下來，變得更加“智慧”，則是機器視覺發展的核心訴求。在這個過程中，第三個要素將發揮至關重要的作用，它就是“人工智慧”。利用深度學習等人工智慧的核心技術，機器視覺將獲得自我學習演化、不斷反覆運算增強的能力，越用越“聰明”。

人工智慧與機器視覺相結合，比較經典的做法就是將採集到的資料傳輸到雲端，在雲端訓練出一個具有資料分析判斷和自我學習進化能力的最強“大腦”。與此同時，今天也有人在考慮，依託性能日益強大的機器視覺終端的能力，直接對終端進行訓練，讓深度學習的演算法在終端產品上落地，以獲得更好的即時、準確率、可靠性，也避免了在雲端可能存在的隱私安全等方面的問題。無論是哪種思路，其成功的應用，無疑都會對機器視覺的未來產生深遠的影響。

總之，在機器的世界裡，人類眼睛的工作——至少是部分工作——已經成了簡單重複性的“力氣活兒”，在諸多要素的合力下，機器視覺代替甚至超越人類視覺的進程，已經停不下來了。

▲回頁首

avnet.com/apac