2011年微軟進行的一項調查顯示,有94%的使用者認為基於地理位置的服務具有價值。但是調查中也顯示,52%的人也關注與使用地理位置資料有關的隱私問題。我們在生活中使用GPS、IP位址及Wi-Fi獲取基於位置的服務,實現即時導航、本地天氣、地理定位的功能,但在無形之中,它也洩露了我們的隱私。
此前資料科學家Anthony Tockar在西北大學讀研究生時,就採用可公開獲取的位置資料,通過交叉參考公共新聞與照片,跟蹤位於紐約市的名人。
隱私問題已經成為了研究界所關注的焦點,南洋理工大學的蕭小奎表示,「現在的計算能力與公開資料的規模可以使我們更容易地從資料中識別對方。」
日前蕭教授與微軟亞洲研究院的謝幸博士已經發現了一種可以緩解隱私問題的一種方式。這種名為PrivTree的資料操作技術能對地理位置資料進行預處理,以保障個人隱私。隨後,這些已經進行過隱私處理的資料可以安全地應用於任何預測分析,而不會對隱私造成進一步風險。
PrivTree的原理是通過數學方法的「模糊」(blurring)對地理資訊進行處理,但保持整個資料集的總體準確性。以下圖為例,資料集裡的個體在地圖上呈現各自的座標。
接下來,PrivTree通過兩個步驟對地理位置資訊進行模糊處理。
地圖分區(Map Partitioning),也就是基於資料點的密度,將圖片分割成若干區域。
位置擾動(Location Perturbation),即採用統計分析方法,個體受擾動方案隨機被摸除、添加或混洗以保證隱私及統計的準確性。在對每個子區域的應用位置擾動後,新的地理位置資料庫最終形成。
這些新資料點遵循與原始資料類似分佈,但每個個體的真實位置被掩蓋了。這些被處理過的資料可以做為PrivTree的資料釋出。而這個資料集能夠拓展為支援各類位置資料的應用——比如你每天的慢跑路線會上傳到健康應用程式。具體論文《PrivTree: A Differentially Private Algorithm for Hierarchical Decompositions》已經被ACM SIGMOD 2016收錄。
蕭教授表示,「微軟亞洲研究院在管理海量地理位置資料上有著豐富經驗,比如北京計程車資料等。這些資料能夠説明我們開發測試我們的模型。」他計畫進一步將PrivTree技術集成到微軟基於位置的服務裡,為使用者提供隱私保護。
「資料隱私是雲計算時代所面臨的一個關鍵挑戰,尤其是對於包含大量個人資訊的使用者生成的位置資料。我們希望這項合作能夠為所有人建立一個更加安全的世界,」謝幸博士表示。
相關文章
-
WZor:微軟將在3月份發佈Win10創造者更新RTM版
-
微軟亞洲研究院院友會,AI大牛新動向|AI科技評論週刊
-
徐迎慶:這7年我們如何做出一款讓盲人走進互聯網的產品 | 微軟亞洲研究院院友會
-
AI 風向標:微軟亞洲研究院召開人工智慧研討會
-
二十一世紀的計算 | 微軟亞洲研究院洪小文54頁PPT講述人工智慧和人類智慧的 “共進化”
-
微軟亞洲研究院提出兩大創新模組,構建可變形卷積神經網路
-
微軟亞洲研究院主任研究員鄭宇博士:如何用深度學習處理時空大資料 | CCF-ADL 火熱報名中
-
FTCon2017|微軟亞洲研究院閆鶯:乙太坊的性能與隱私保護如何兼得?
-
擔心隱私洩露!四成美國電視觀眾不踏實
-
微軟亞洲研究院鄭宇:人工智慧在城市管理中的應用
-
今年的科隆展有些黯淡!微軟確認不舉行發佈會
-
Surface Pro(2017)換新衣:微軟聯合芬蘭公司Marimekko訂制貼紙