根據(jù)美國(guó)自動(dòng)成像協(xié)會(huì)(AIA)的定義,機(jī)器視覺(jué)(Machine Vision)是一種基于捕獲并處理的圖像為執(zhí)行設(shè)備提供操作指導(dǎo)的硬件和軟件的組合。
如下圖,典型的機(jī)器視覺(jué)系統(tǒng)分為成像和圖像處理分析兩大部分。成像部分包括光源及光源控制器、鏡頭、相機(jī)等硬件部分,負(fù)責(zé)輸出符合系統(tǒng)要求的圖像。視覺(jué)控制系統(tǒng)負(fù)責(zé)對(duì)成像結(jié)果進(jìn)行處理分析并根據(jù)分析結(jié)果控制PLC等執(zhí)行設(shè)備執(zhí)行對(duì)應(yīng)操作。
機(jī)器視覺(jué)系統(tǒng)的構(gòu)成
圖源:Vital Vision
機(jī)器視覺(jué)主要功能按照難度遞增可分為識(shí)別、測(cè)量、定位及檢測(cè),通過(guò)機(jī)器代替人工進(jìn)行測(cè)量與判斷,將圖像處理應(yīng)用于工業(yè)自動(dòng)化領(lǐng)域中。 識(shí)別:基于目標(biāo)物體的物理特征,如外形、顏色、數(shù)字、條碼、人臉等進(jìn)行甄別。 測(cè)量:將獲取的圖像像素信息標(biāo)定成常用度量衡單位,再在圖像中精確計(jì)算目標(biāo)物的幾何尺寸。 定位:基于圖像標(biāo)定、目標(biāo)檢測(cè)、尺寸查找等算法,獲得目標(biāo)物關(guān)于二維或三維的位置信息,然后引導(dǎo)機(jī)器人進(jìn)行定位或者組裝。 檢測(cè):難度最高,主要指外觀檢測(cè),對(duì)產(chǎn)品裝備后的完整性檢測(cè)、外觀缺陷檢測(cè)等。
機(jī)器視覺(jué)3D外觀檢測(cè)
圖源:iqsdirectory
機(jī)器視覺(jué)產(chǎn)業(yè)鏈從上游到下游分為三大類。
核心零部件供應(yīng)商:上游零部件主要包括光源、鏡頭、2D/3D相機(jī)、傳感器、圖像采集卡等。關(guān)鍵零部件和軟件系統(tǒng)約占工業(yè)機(jī)器視覺(jué)產(chǎn)品總成本的80%。
AI相機(jī)和圖像采集卡
圖源:adlink
機(jī)器視覺(jué)上游零部件成本占比較高,是機(jī)器視覺(jué)的核心部分。其中光源、工業(yè)相機(jī)、底層軟件算法等技術(shù)壁壘及利潤(rùn)率水平較高,因此對(duì)機(jī)器視覺(jué)上游環(huán)節(jié)的掌握是目前市場(chǎng)競(jìng)爭(zhēng)的關(guān)鍵。 軟件及AI服務(wù)商:以集成通用算法軟件開發(fā)包和 AI 加速平臺(tái)服務(wù)商為主,幾乎來(lái)自海外龍頭公司。在機(jī)器視覺(jué)中,軟件算法主要作用包括:圖像預(yù)處理、特征提取、物體檢測(cè)與識(shí)別,以及場(chǎng)景解析等,相關(guān)應(yīng)用需要同時(shí)基于傳統(tǒng)的計(jì)算機(jī)視覺(jué)技術(shù),以及以深度學(xué)習(xí)為代表的AI相關(guān)技術(shù)。 物體檢測(cè)與識(shí)別、特征提取 圖源:3hle.ch 伴隨AI技術(shù)發(fā)展,軟件算法亦在持續(xù)不斷升級(jí)更新,推進(jìn)在機(jī)器視覺(jué)從過(guò)去傳統(tǒng)標(biāo)準(zhǔn)化檢測(cè)場(chǎng)景過(guò)渡到非標(biāo)定制化場(chǎng)景。 視覺(jué)系統(tǒng)及解決方案集成商:方案集成商以工業(yè)自動(dòng)化非標(biāo)設(shè)備及方案為主。在視覺(jué)檢測(cè)系統(tǒng)中,工件位置的一致性,打光的穩(wěn)定性,物體的運(yùn)動(dòng)速度,高精度測(cè)量的標(biāo)定,軟件的測(cè)量精度都會(huì)對(duì)系統(tǒng)產(chǎn)生影響。
在線視覺(jué)檢測(cè)系統(tǒng)
圖源:Cielotech
對(duì)于工業(yè)現(xiàn)場(chǎng)或者生產(chǎn)線,將視覺(jué)系統(tǒng)嵌入到生產(chǎn)線的相應(yīng)工序中,適配產(chǎn)線的生產(chǎn)速度是方案集成的關(guān)鍵難點(diǎn)。
機(jī)器視覺(jué)已廣泛應(yīng)用于消費(fèi)電子、汽車制造、半導(dǎo)體、光伏等標(biāo)準(zhǔn)化領(lǐng)域。在標(biāo)準(zhǔn)化的工業(yè)環(huán)境中,機(jī)器視覺(jué)主要運(yùn)用于產(chǎn)品質(zhì)量檢測(cè)、裝配檢測(cè)和包裝檢測(cè)等環(huán)節(jié)。這些環(huán)節(jié)的檢測(cè)任務(wù)具有高度的規(guī)律性和標(biāo)準(zhǔn)化,因此,常常采用模式匹配、特征識(shí)別等技術(shù),根據(jù)預(yù)設(shè)的規(guī)則進(jìn)行決策。
機(jī)器視覺(jué)領(lǐng)域在AI加持下迎來(lái)底層技術(shù)突破,Meta發(fā)布的首個(gè)圖像分割基礎(chǔ)模型SAM(Segment Anything Model,分割一切),其底層以NLP模型的通用方式解決圖像分割和識(shí)別問(wèn)題。
SAM2模型進(jìn)行圖像分割的過(guò)程
圖源:Learn OpenCV
分割技術(shù)是圖像處理的底層技術(shù),用于查找和分割圖像中的任何對(duì)象,該可應(yīng)用于各種領(lǐng)域。圖像處理的各種通用模型,極大地降低了圖像處理的門檻,是機(jī)器視覺(jué)領(lǐng)域的底層突破性技術(shù)。 在AI加持下,機(jī)器視覺(jué)迎來(lái)了底層技術(shù)的突破。從算法、技術(shù)到應(yīng)用,AI技術(shù)極大程度賦能機(jī)器視覺(jué)在圖像模型上的智能化應(yīng)用,優(yōu)化了圖像識(shí)別的復(fù)雜度及精度。從而推動(dòng)機(jī)器視覺(jué)在缺陷檢測(cè)、醫(yī)療影像、衛(wèi)星遙感等非標(biāo)準(zhǔn)化場(chǎng)景的應(yīng)用。
AI+機(jī)器視覺(jué),應(yīng)用場(chǎng)景持續(xù)拓展-中泰證券