在計算機視覺技術(shù)中,許多方法用于評估輸入并獲得輸出。圖像分類,對象檢測,對象跟蹤和圖像分割等技術(shù)可通過組合或單獨使用來幫助創(chuàng)建計算機視覺。已經(jīng)為深度學(xué)習(xí)創(chuàng)建了許多不同的架構(gòu),但是CNN架構(gòu)是CV領(lǐng)域中常用的架構(gòu)。該技術(shù)的缺點是數(shù)據(jù)集需求大,優(yōu)化困難和黑匣子。
圖片分類:
圖像分類旨在根據(jù)圖像的類型對圖像中的內(nèi)容進行分類。廣泛使用的深度學(xué)習(xí)技術(shù)是卷積神經(jīng)網(wǎng)絡(luò)(CNN)。
預(yù)先標記的圖像會創(chuàng)建訓(xùn)練數(shù)據(jù)集,包含圖像的每個類都有單獨的屬性,這些屬性由矢量表示。這些向量使用CNN進行訓(xùn)練,并使用新的數(shù)據(jù)集進行了改進。如果分類器的質(zhì)量不足,則可以添加更多的測試集或訓(xùn)練集。
對象檢測:
圖像中對象的識別具有與圖像分類不同的工作原理,為了對圖像中的對象進行分類,須在邊界框中確定這些對象。為了對圖像中的對象進行分類,須在框中確定這些對象。盡管這些盒子的尺寸不同,但它們可能包含相同類別的圖像。同樣,檢測包含大量對象的圖像也需要增加計算機能力。已經(jīng)開發(fā)出了諸如R-CNN,快速R-CNN,YOLO,單發(fā)多盒檢測器(SSD)和基于區(qū)域的完全卷積網(wǎng)絡(luò)之類的算法來快速發(fā)現(xiàn)這些事件。
對象跟蹤:
對象跟蹤是一種通過在下一幅圖像中找到同一對象來跟蹤圖像中對象運動的方法。根據(jù)觀察方法,對象跟蹤技術(shù)可以分為三類:
生成技術(shù):在此技術(shù)中,跟蹤問題被公式化為搜索與目標模型相似的圖像區(qū)域。主成分分析(PCA),獨立成分分析(ICA),非負矩陣分解(NMF)是生成模型的示例,這些模型試圖找到合適的原始數(shù)據(jù)表示形式。
判別技術(shù):在判別方法中,監(jiān)視被視為二進制分類問題,其目的是找到能將目標與背景區(qū)分開的決策極限。與生成方法不同,同時使用目標信息和背景信息。判別方法的示例是堆疊式自動編碼器(SAE),卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(SVM)。
混合技術(shù):將這兩種技術(shù)結(jié)合使用,并根據(jù)問題采用不同的技術(shù)。
? ? ?圖像分割:
將數(shù)字圖像分為圖像對象或像素集的過程。圖像分割的目的是簡化圖像的表示并促進分析。
由于圖像分割有許多不同的方法,因此可以使用Mask R-CNN和完全卷積網(wǎng)絡(luò)(FCN)進行密集預(yù)測,而無需任何完全連接的層。