一般來說基于圖像處理的自動對焦的方法有兩種,第一種是通過計算對焦深度得到的,第二種是通過計算離焦深度得到的。
這兩種方法的原理說明起來比較麻煩,簡單來說,離焦深度方法是從離焦圖像中獲得模糊程度和深度信息,根據(jù)二者加上對應(yīng)的拍攝參數(shù)來計算清晰度評價值,并結(jié)合這些所有值,得到需要調(diào)整的具體量,因為需要的圖像較少,所以速度較快。
對焦深度方法要麻煩一些,首先需要一系列模糊程度不同的圖像,計算這一系列圖像的清晰度評價值,之后對這一系列值以擬合的方式得到評價曲線,根據(jù)評價曲線的峰值確定最佳對焦位置,這種方法精度高,但速度慢。
需要說一點題外話就是,雖然這個些過程一樣,但不同的廠商的計算方法其實有些不同,所以一樣的對比度對焦,有的廠家就快,有的廠家就慢。
這兩種方法都不離開一個東西,就是清晰度評價值,清晰度評價值類似一個統(tǒng)計量,是根據(jù)一些參數(shù)經(jīng)過某種處理之后得到的,當(dāng)然清晰度評價值還有其他的要求,比如有效性/魯棒性等。
平常計算清晰度評價值的方法一般有這么幾種(不全面,還有其他的很多):
第一種是頻譜函數(shù)的方法,清晰的圖像對比相應(yīng)的不清晰圖像在相應(yīng)頻譜分量上含有更多的信息,一種反映出來就是頻譜函數(shù)的幅值,可以利用這種方法評價。
第二種是信息熵,清晰的圖像的信息熵大于相應(yīng)的不清晰圖像,這個原始證明很繁瑣,所以這里用數(shù)據(jù)處理定理反證:1.清晰的圖像處理后可以得到不清晰的圖像。 2.但不清晰的圖像無論如何處理都不能單獨得到清晰的圖像。 3.所以清晰圖像的信息熵大于相應(yīng)的不清晰圖像,如果有方法計算出信息熵,則可以用熵來評價。
第三種是梯度函數(shù),在圖像中梯度函數(shù)是一個可以衡量某變量變換率快慢的函數(shù),正確對焦的圖像有較為清晰的邊緣,而在邊緣的地方更為銳利,往往有變化率的最大值,或者說變化最不連續(xù),如此一來也可以評價清晰度。
現(xiàn)在常用的是第三種,也就是梯度,梯度在數(shù)學(xué)上是變換率的表征,在實際計算的時候我們可以用方差、能量梯度或者拉普拉斯算子(等價于二階微分)或者其他一些方法來實現(xiàn),這些計算方法本身各自的復(fù)雜度不同,但最影響計算量的是選取圖像中像素點的多寡,比如一個對比度對焦選款,是取中央一點,還是邊緣四點,還是對角線五點?這都是各個相機廠家考慮的問題。