為了給機器賦予人類的理解和思考能力,科學(xué)家們創(chuàng)造了卷積神經(jīng)網(wǎng)絡(luò)(CNN)。雖然它們需要高度復(fù)雜的算法,能夠模擬人類思維的過程,但它們并不難理解,卷積并不意味著復(fù)雜。
幫助機器像人類一樣思考
卷積神經(jīng)網(wǎng)絡(luò)和嵌入式視覺領(lǐng)域的研發(fā)者不只是想讓機器變得更快。他們想讓機器變得更聰明。我們的目標(biāo)是幫助機器像人類一樣看待世界,以同樣的方式看待世界,然后應(yīng)用他們所擁有的知識。一些用途包括圖像識別、圖像分類和自然語言處理。
作為人類,我們不斷地分析我們的環(huán)境。我們還對我們所看到的進行標(biāo)記和預(yù)測。例如,您可能知道較近的出口在哪里。每扇門都在你進入大樓的路上。你的大腦在緊急情況下已經(jīng)準(zhǔn)備好了,但是你還記得今天早上你送進辦公室的熒光燈的數(shù)量嗎?
你的大腦會自動處理這個工作量。它被硬連接到你的DNA里。這看起來可能很簡單,但是將這個過程編到CNN上是很有挑戰(zhàn)性的。CNN須接受輸入,確定什么是重要的,分類,預(yù)測下一步該做什么,然后采取行動。但是這種人工智能與嵌入式視覺有什么關(guān)系呢?
卷積神經(jīng)網(wǎng)絡(luò)與嵌入式視覺
CNN可以被訓(xùn)練成以人類的方式看待世界。CNN不需要對它可能遇到的每一個物體的每一個特征進行訓(xùn)練,而是可以使這個過程自動化。利用嵌入式視覺,機器可以通過將對象與龐大的數(shù)據(jù)集進行比較來識別對象。當(dāng)他們犯錯誤時,他們甚至可以調(diào)整他們的分類參數(shù)。
卷積神經(jīng)網(wǎng)絡(luò)甚至與視覺聯(lián)系在一起,因為它們是在3D中組織的。它們有寬度、高度和深度。網(wǎng)絡(luò)中的人工神經(jīng)元連接到附近的其他神經(jīng)元。CNN使用一種稱為卷積的技術(shù),在輸入中添加一個濾波器,然后為CNN認為它看到的對象繪制概率圖。
CNN是圖像分類的理想方法。這就是為什么它們與嵌入式視覺如此完好地結(jié)合在一起的原因。他們可以快速地從圖像中提取數(shù)據(jù),然后對數(shù)據(jù)進行分類。嵌入式視覺系統(tǒng)通常具有大帶寬容量和低功耗,這正是CNN所需要的。