| |
你能“看見”的,比你看見的多得多!

今天除了人類自己的眼睛,還有越來越多的“機器之眼”在說明我們觀察、記錄和分析著周遭的這個世界,讓我們實際的視覺能力大為擴展和增強。目前在中國,由公安引導安裝的監控攝像機就超過了2000萬台,一個月的資料流程量達7500PB。再考慮到那些家庭和個人安裝的監控攝像頭,我們愛車上倒車影像、行車記錄儀等視覺傳感裝置,以及GoPro這種拉風的消費級數碼視覺單品……不知不覺中,我們已經置身於一個機器視覺的汪洋大海中。
顧名思義,機器視覺的核心價值,就是代替人眼和人腦對圖像和視頻資訊作出感知和分析判斷。雖然機器視覺不算一個新概念,卻在過去的10年中獲得了高速的發展,且在可以預見的未來仍然保持相當的加速度。機器視覺這樣一種發展態勢,得益於三個因素。
第一個因素就是摩爾定律。從硬體的角度來看,一個機器視覺系統包含兩個核心的器件:一個是CMOS圖像感測器(攝像頭),一個是處理器。而這兩者都是可以通過標準CMOS半導體工藝製造的,因此也就被套上了摩爾定律的的“魔咒”,在似乎永無止境的追求“三低一高”(低功耗、低成本、小尺寸、高性能)的征途上一路狂奔,不斷拉低機器視覺的獲取成本。想一想今天一個入門級手機攝像頭的解析度,可能和幾年前中高端單反相機圖像感測器的級別相當,這恐怕就是用戶對摩爾定律作用最直觀的感受了。
摩爾定律同樣在推動處理器性能的提升,使其完全可以勝任複雜的影像處理計算。在處理器硬體架構的選擇上,今天機器視覺的開發者有多種選擇:可以選擇專門為影像處理優化的DSP;也可以選擇採用ARM+GPU或其他圖像輔助處理器的平臺;還有基於ARM+FPGA可程式設計邏輯的異構處理架構(如Xilinx Zynq 7000)可供使用。即使是主流的ARM通用處理器平臺,配合優化的軟體演算法,同樣可以在很多機器視覺應用中施展拳腳。想要獲得性價比更高的機器視覺處理器,對使用者來說只是一個時間問題。
推動機器視覺快速發展的第二個因素,就是日益豐富的演算法和軟體資源。可以說被摩爾定律“綁架”了的硬體降低了機器視覺的使用門檻,但想真正讓機器像“人眼+人腦”一樣運轉起來,甚至更高能和高效地運轉,就必須要有軟體的配合。在上個世紀,做機器視覺的演算法和軟體,絕對是一個燒腦的工作,公司裡沒有幾個Ph.D是不敢開張的。這樣的局面從2000年起發生了改變——那一年Intel發佈了OpenCV,這是一個基於BSD許可的開源跨平臺電腦視覺庫,開發者通過一系列C/C++函數可以方便地實現很多圖像和視覺處理方面的通用演算法。從那時起,基於不斷更新的OpenCV庫,演化出了為不同機器視覺應用而優化的功能和演算法,且更容易在嵌入式處理器中移植和運行,由此逐漸形成了完備的機器視覺軟體生態系統。與此同時,很多商業版的軟體發展工具也開始將視覺處理功能集成在其中,令機器視覺的應用開發更加觸手可及。

圖1,Avnet提供的Blackfin嵌入式視覺學習開發套件,包括完整的硬體和軟體資源,可以説明機器視覺開發者快速上手
可以說,硬體和軟體生態環境的成熟,造就了過去十年機器視覺版圖的快速擴張。而接下來,變得更加“智慧”,則是機器視覺發展的核心訴求。在這個過程中,第三個要素將發揮至關重要的作用,它就是“人工智慧”。利用深度學習等人工智慧的核心技術,機器視覺將獲得自我學習演化、不斷反覆運算增強的能力,越用越“聰明”。
人工智慧與機器視覺相結合,比較經典的做法就是將採集到的資料傳輸到雲端,在雲端訓練出一個具有資料分析判斷和自我學習進化能力的最強“大腦”。與此同時,今天也有人在考慮,依託性能日益強大的機器視覺終端的能力,直接對終端進行訓練,讓深度學習的演算法在終端產品上落地,以獲得更好的即時、準確率、可靠性,也避免了在雲端可能存在的隱私安全等方面的問題。無論是哪種思路,其成功的應用,無疑都會對機器視覺的未來產生深遠的影響。
總之,在機器的世界裡,人類眼睛的工作——至少是部分工作——已經成了簡單重複性的“力氣活兒”,在諸多要素的合力下,機器視覺代替甚至超越人類視覺的進程,已經停不下來了。
▲回頁首
|
|
|