微軟亞洲研究院提出兩大創新模組，構建可變形卷積神經網路

論文摘要

由於用於構建卷積神經網路（CNNs）的各個模組具有較為固定的幾何結構，從而在根本上限制了 CNNs 演算法對幾何變換的建模。雷鋒網瞭解到，在《Deformable Convolutional Networks》這篇論文中，來自微軟亞洲研究院的研究員們提出了兩種全新的模組 Deformable convolution 和 Deformable RoI pooling 用於提升 CNNs 演算法對幾何變換的建模能力。

上圖展示了一個 3 x 3 大小的 Deformable convolution 結構

Deformable convolution 和 Deformable RoI pooling 兩種模組構建的思想分別是：

在提供了額外偏移的情況下增加模組中的空間採樣位置（見 Figure 2）；

在沒有額外監督的情況下從目標任務學習偏移（見 Figure 3）。

上圖展示了一個 3 x 3 大小的 Deformable RoI pooling 結構

值得一提的是，這兩個模組都可以輕而易舉地取代現有卷積神經網路（CNNs）中的相對應模組，並且也可以通過標準的反向傳播演算法進行端到端（End-to-End）的訓練從而產生可變形的卷積網路（Deformable convolutional networks）。

上圖中(a)展示了傳統卷積操作中兩層固定的感受野，而(b)展示可變形卷積操作中兩層可自我調整的感受野。(a)與(b)兩圖遵循相同的結構，自上而下分別是：1、最頂層的圖片中展示兩個啟動單元，它們分位於不同形狀與大小的物體中，而它們的輸入來自於一個3x3大小的濾波器；2、中間的圖片展示了兩個3x3大小的濾波器在前一個特徵圖（feature map）上的採樣位置，並且其中依然有兩個啟動單元被高亮出來；3、最底層的圖片中展示了在前一個特徵圖上兩個層級的3x3大小的濾波器的採樣位置，其中有兩組採樣位置被高亮出來，它們分別對應於上一層圖片中的高亮單元。

據雷鋒網瞭解，微軟亞洲研究院的研究員們已經通過大量的實驗驗證了該新方法對於物體檢測和語義分割這兩個複雜視覺任務具有有效性，並且相關的實驗代碼也將被公開出來。

via

Deformable Convolutional Networks

，雷鋒網編譯

微軟亞洲研究院提出兩大創新模組，構建可變形卷積神經網路

擔心隱私洩露？微軟亞洲研究院發佈PrivTree項目保你安全

建矽谷研究院，搞無人駕駛，辦技術比賽，滴滴想幹什麼？

微軟研究院資深主任研究員鄭宇教授：多來源資料融合與時空資料採擷（一）

微軟亞洲研究院院友會，AI大牛新動向｜AI科技評論週刊

徐迎慶：這7年我們如何做出一款讓盲人走進互聯網的產品 | 微軟亞洲研究院院友會

AI 風向標：微軟亞洲研究院召開人工智慧研討會

二十一世紀的計算 | 微軟亞洲研究院洪小文54頁PPT講述人工智慧和人類智慧的 “共進化”

訪談 | 在機器人搜尋引擎誕生前，微軟研究院要做一本“花名冊”

微軟亞洲研究院主任研究員鄭宇博士：如何用深度學習處理時空大資料 | CCF-ADL 火熱報名中

FTCon2017｜微軟亞洲研究院閆鶯：乙太坊的性能與隱私保護如何兼得？

微軟亞洲研究院鄭宇：人工智慧在城市管理中的應用

MIT CSAIL最新研究：Network Dissection可全自動內窺神經網路活動過程