oregoncenterfornursing
雷鋒網AI科技評論按:Geoffrey Hinton 於 2013 年加入穀歌,目前在穀歌大腦團隊致力將深度學習應用於實踐領域。近日,穀歌大腦團隊推出了新作,一作 Melody Y. Guan 及 Varun Gulshan、Andrew M. Dai 及 Hinton 提出了一種創新的方法,通過給個體標籤建模來提高分類能力。
論文連結:
https://arxiv.org/pdf/1703.08774.pdf
給資料集進行標記的任務通常是由許多不同的專家分工完成的,每位元專家只標記其中一小部分資料而同一個資料點又包含有多位元專家所標記的標籤。這樣的做法不僅減輕了每位專家的個人工作量並且還有助於揭開資料中難以發現的真相。當專家們對同一個資料點的標籤存在不同意見時,標準的做法是將獲得更多專家支持的標籤作為正確的標籤,或者將正確的標籤進行建模以獲得分佈狀態。
但是,這樣的做法忽視了有關於哪些專家標記了哪些標籤這一潛在的有效資訊。因此為了獲得這些額外的資訊,穀歌大腦團隊提出要單獨對專家進行建模,然後學習平均權重以組合這些資訊,比如說可能是以樣本特定(sample-specific)的方式進行組合。通過這種方法,就能給更可靠的專家分配更多的權重,並利用個別專家的獨特優勢來對某些特定類型的資料進行分類。
在這篇論文中,雷鋒網瞭解到,作者展示了通過採用這種標記方法我們提升了電腦輔助診斷糖尿病導致視網膜病變的準確度,並且此方法的表現也優於Welinder和Perona以及Mnih和Hinton所提出的方法。穀歌大腦團隊的工作提供了一種創新的方法,以處理那些數量巨大的、需要借助專家來標記標籤的現實資料。
Via
Who Said What: Modeling Individual Labelers Improves Classification
,雷鋒網編譯