該研究是基于復雜場景的多商品檢測任務
在日常購物時,我們不妨暢想一下未來的場景:無需結算臺,因為消費者取下產品的過程中,就可以完成自動結算;也無需貨架管理員,因為智能貨架管理技術可以實時動態監測商品數量變化,并完成數據分析。不過,要實現這種智能化消費方式變革的核心難點在于解決目標檢測計數聯合任務領域中的遮擋問題。
近日,中國科學院軟件研究所智能軟件研究中心發布了目前為止最大的零售場景目標檢測計數聯合任務數據集——Locount,為解決零售場景下目標檢測領域嚴重遮擋問題提供了重要基礎。相關論文在國際人工智能會議(AAAI2021)上發表。
該研究發現,現在的目標檢測任務通常使用一個矩形框來預測單個目標的位置,因為傳統目標檢測數據集的遮擋比例較少,尤其缺少多個目標之間嚴重遮擋的情況(例如多個目標重疊比例超過90%)?!翱善诹闶蹐鲋袇s普遍存在這種情況,商超貨架內的商品通常在上下和前后兩個方向上有所重疊?!闭撐耐ㄓ嵶髡?、中科院軟件所副研究員張立波告訴《中國科學報》,傳統的表示方法無法適用于商品零售場景,因為同一類別商品重疊擺放會存在嚴重遮擋的現象,在實際使用中也無需精確定位每一個實例目標。
于是,研究團隊提出了一種同時進行對象定位和計數的新任務?!熬唧w來說,如果多個目標是相互嚴重遮擋且屬于同一個類別,新的任務為預測出該目標簇中所有目標框合并的最小包圍框及對應的實例數量?!睆埩Σń忉?。
傳統目標計數(a)和目標檢測;(b)數據集中采樣的標注圖片;(c)傳統的檢測標注應用到本項研究的數據集的呈現形式;(d)新的檢測標注方式在本項研究的數據集上的呈現方式
而為了實現這一新任務,研究團隊經過近2年的廣泛收集及測試研究,設計出了迄今為止最大的零售場景目標檢測計數聯合任務數據集——Locount,填補了現實場景中檢測和計數聯合訓練問題的空白。
張立波介紹,該數據集包含了190多萬個商品實例標注信息,涵蓋了140種商品類別。其中每個標注框包含了同類商品實例及其數量,與其他商品類型數據集相比,具有明顯優勢。
Locount數據集中的商品分類
此外,為了評估不同算法在該任務上的性能,研究團隊還設計了一種新的評價標準,以反映算法出現目標丟失、對同一實例的重復檢測、錯誤檢測、錯誤計數等情況。
這項研究認為,傳統方法和常見的深度學習網絡還無法很好地解決Locount提出的新挑戰。為了能更好地研究復雜和密集場景下,尤其是目標高度重疊時的檢測和計數問題,張立波希望更多開發人員能夠借助Locount數據集,探索出更準確、高效的任務解決思路和方法。同時,這一數據集也可以為現實場景中長尾分布、少樣本學習等多個潛在的研究方向提供基礎支持。
相關論文信息:
https://isrc.iscas.ac.cn/gitlab/research/locount-dataset/-/blob/master/AAAI2021_CLCNet.pdf
數據集下載地址及密碼:
https://pan.baidu.com/s/13JJAHz2VXD0KewdcemfsXQ#list/path=%2F fyze