訂閱
糾錯
加入自媒體

一文教你使用Dice loss實(shí)現(xiàn)清晰的邊界檢測

前言:

在深度學(xué)習(xí)和計算機(jī)視覺中,人們正在努力提取特征,為各種視覺任務(wù)輸出有意義的表示。在一些任務(wù)中,我們只關(guān)注對象的幾何形狀,而不管顏色、紋理和照明等。這就是邊界檢測的作用所在。

本文來源于公眾號CV技術(shù)指南的技術(shù)總結(jié)系列。

更多內(nèi)容請關(guān)注公眾號CV技術(shù)指南,專注于計算機(jī)視覺的技術(shù)總結(jié),最新技術(shù)跟蹤。

問題定義

使用Dice loss實(shí)現(xiàn)清晰的邊界檢測

圖1 邊界檢測

圖1是一個邊界檢測的例子,顧名思義,邊界檢測是從圖像中檢測對象邊界的任務(wù)。這是一個不適定的問題,因?yàn)閱栴}設(shè)置本身存在歧義。如圖所示,對于室內(nèi)房間圖像(左),ground truth(中)定義房間內(nèi)的ground truth對象邊界,并且預(yù)測(右)估計房間的對象邊界。然而,我們可以看到,估計的邊界遠(yuǎn)不止是ground truth,包括來自房間布局、窗簾,甚至沙發(fā)紋理的不必要的邊界線。提取干凈且有意義的對象邊界并不容易。

原始方法

邊界檢測的一個直接解決方案是將其視為語義分割問題。在標(biāo)注中簡單地將邊界為1和其他區(qū)域標(biāo)記為0,我們可以將其表示為一個二分類語義分割問題,以二值交叉熵?fù)p失為損失函數(shù)。然而,它有兩個原因:高度不平衡的標(biāo)簽分布和每像素交叉熵?fù)p失的內(nèi)在問題。

Cross Entropy Loss的局限性

當(dāng)使用交叉熵?fù)p失時,標(biāo)簽的統(tǒng)計分布對訓(xùn)練精度起著很重要的作用。標(biāo)簽分布越不平衡,訓(xùn)練就越困難。雖然加權(quán)交叉熵?fù)p失可以減輕難度,但改進(jìn)并不顯著,交叉熵?fù)p失的內(nèi)在問題也沒有得到解決。在交叉熵?fù)p失中,損失按每像素?fù)p失的平均值計算,每像素?fù)p失按離散值計算,而不知道其相鄰像素是否為邊界。因此,交叉熵?fù)p失只考慮微觀意義上的損失,而不是全局考慮,這還不足以預(yù)測圖像水平。

使用Dice loss實(shí)現(xiàn)清晰的邊界檢測

圖2 具有交叉熵?fù)p失的邊界預(yù)測

如圖2所示。對于輸入圖像(左),比較了交叉熵?fù)p失(中)和加權(quán)交叉熵?fù)p失(右)的預(yù)測。右邊的邊界比中間的要好得多,但預(yù)測的邊界并不干凈,骯臟的草地紋理邊界仍然存在。

Dice Loss

Dice Loss起源于S?rensen-Dice系數(shù),這是20世紀(jì)40年代用來測量兩個樣本之間的相似性的統(tǒng)計數(shù)據(jù)。它是由米勒塔里等人帶到計算機(jī)視覺的。2016年進(jìn)行三維醫(yī)學(xué)圖像分割。

使用Dice loss實(shí)現(xiàn)清晰的邊界檢測

圖3 骰子系數(shù)

上式顯示了骰子系數(shù)方程,其中pi和gi分別表示對應(yīng)的像素預(yù)測值和ground truth。在邊界檢測場景中,pi和gi的值為0或1,表示像素是否為邊界,是的時候值為1,否則值為0。因此,分母是預(yù)測和ground truth的總邊界像素的和,數(shù)值是正確預(yù)測的邊界像素的和,因?yàn)橹挥挟?dāng)pi和gi值匹配時(兩個值1)才遞增。

使用Dice loss實(shí)現(xiàn)清晰的邊界檢測

圖4 骰子系數(shù)(設(shè)定視圖)

圖4是圖3的另一個視圖。從集理論的角度來看,其中骰子系數(shù)(DSC)是兩個集合之間重疊的度量。例如,如果兩組A和B完全重疊,DSC的最大值為1。否則,DSC開始減少,如果兩個組完全不重疊,則最小值為0。因此,DSC的范圍在0到1之間,越大越好。因此,我們可以使用1-DSC作為骰子損失來最大化兩組之間的重疊。

在邊界檢測任務(wù)中,ground truth邊界像素和預(yù)測的邊界像素可以被視為兩個集合。通過利用Dice Loss,這兩組被訓(xùn)練一點(diǎn)地重疊。如圖4所示。分母考慮全局尺度上的邊界像素的總數(shù),而數(shù)值考慮局部尺度上的兩個集合之間的重疊。因此,Dice Loss在本地和全局上都考慮了損失信息,這對于高精度至關(guān)重要。

結(jié)果

使用Dice loss實(shí)現(xiàn)清晰的邊界檢測

圖5 邊界預(yù)測的結(jié)果

如圖5所示。使用Dice Loss(c列)的預(yù)測結(jié)果比其他方法(d、e列)具有更高的精度。特別是對于薄邊界,因?yàn)橹挥挟?dāng)預(yù)測的邊界像素與ground truth薄邊界重疊,并且在其他區(qū)域沒有預(yù)測的邊界像素時,才可以減少Dice Loss

image.png

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號