機器視覺就像智慧生物的眼睛一樣,能夠快速、直觀地獲得外界空間的各類視覺信息,實現(xiàn)所見即所得。機器無法像人類一樣觀察周圍的世界,是因為缺乏一雙與人一樣的眼睛,機器可以在某些單項能力方面遠遠超過人類,但綜合起來卻與人類又有很大的差別。
1.現(xiàn)有視覺系統(tǒng)功能的單一性。以智能交通系統(tǒng)為例:抓拍車號的相機只能拍車號,不能測速,不能自動辨別車型,而且須在固定位置,須有外部輔助光源和拍照觸發(fā)和啟動傳感裝置;對于闖紅燈和超速的車輛檢測和識別,須要另行配置相機完成。
2.現(xiàn)有視覺系統(tǒng)的專業(yè)局限性和復(fù)雜性?,F(xiàn)有的機器視覺系統(tǒng),都需要有專業(yè)技術(shù)人員進行專門的編程和系統(tǒng)設(shè)計。一個功能對應(yīng)一套軟件和一套專門的系統(tǒng)。
3.現(xiàn)有視覺系統(tǒng)與被攝物和環(huán)境的強相關(guān)性。不同的被攝物,不同的功能要求,需要不同的軟件,同時系統(tǒng)需要配備專用的相機、專用的鏡頭、專用的輔助流水線和專用的輔助燈光和對背景進行特定設(shè)置等等。只要被攝物發(fā)生任何改變,例如:規(guī)格、大小、型號、擺放位置、標簽等發(fā)生改變,都須對程序進行修改和重新設(shè)計。
4.現(xiàn)有視覺系統(tǒng)一般都是基于二維圖像的視覺感知,基本不具備三維實時感知能力。對于三維感知,目前一般采用激光掃描或雙目加結(jié)構(gòu)光的方式,這些方式有時還需要提前標定,還需要完成長時間的三維建模運算,有時還要固定應(yīng)用場景或提前對被視物建模,另外,大部分需要一些人工干預(yù)以及延時和后期處理。
5.現(xiàn)有的圖像識別采用的機器學(xué)習(xí)方法,對于圖像的理解,一般針對特定圖像類別和固定的應(yīng)用場景,還不具有智能生物的視覺感知和視覺理解能力。而且,智能生物對于外部空間和物體是依靠三維感覺而形成,目前的圖像機器學(xué)習(xí)算法,一般都是基于二維圖像數(shù)據(jù),在對空間的感知和理解能力來說,具有先天的缺陷和弱點。
這些不足和問題,不僅局限了機器視覺的應(yīng)用范圍,還讓已有的技術(shù)應(yīng)用復(fù)雜而困難。“我們之前所做的鐵路車輛在線測量就是這樣,復(fù)雜而又辛苦”,作為一個技術(shù)研發(fā)人員,希望通過技術(shù)改變些什么。
縱觀現(xiàn)有的機器視覺應(yīng)用和技術(shù),目前通用的“機器視覺”多數(shù)是由人工智能計算來實現(xiàn)的,一種視覺對應(yīng)一種軟件和系統(tǒng),完成一種固定的視覺任務(wù),在算法和數(shù)據(jù)層面無法實現(xiàn)各視覺系統(tǒng)在機器視覺上的統(tǒng)一。而且,對于圖像內(nèi)容的理解方面,由于神經(jīng)網(wǎng)絡(luò)存在的黑箱性質(zhì),機器無法達到令人信服的對視覺的理解要求。
如果您對此感興趣,可以先了解一下視覺檢測設(shè)備的發(fā)展歷史。