鈦媒體注:本文作者 Silver Keskkula 是Teleportinc 創始人之一 ,也是Skype 核心團隊的首席研究員。作者從五個方面講述了,如何通過AI 技術讓你足不出戶就能找到一處適合自己居住的地方。文章由圖普科技翻譯。
我曾經在《AI將如何重組人口》一文中打趣過我的讀者們。就像線上約會網站決定誰跟誰將製造一個嬰兒,我們將也讓AI技術決定誰將搬去哪兒。所以,我們如何知道如今哪些城市才能被稱為好城市?
我們讀新聞,聽到朋友的好消息,看到照片和視頻,從那裡得到最好的工作機會,而非常平常的是,我們經常只是走馬觀花地去看城市。
我不會去深入剖析AI是如何參與決定哪些新聞,朋友的帖子,視頻或城市的照片將被我們看到,但我將要闡述我們如何使用在Teleport中的AI技術去幫助你更客觀地看待城市。 自從我被《每個孩子都開始程式設計》一文深深吸引後,接下來,我將通過簡單的代碼示例來演示這個文中的過程,以說明使用所有工具玩轉AI已經是一件很容易的事情。
以下想法主要受到來自MIT的StreetScore項目的啟發。
通過AI的眼睛探訪城市讓我們從Teleport Developers API中抓取愛沙尼亞Tartu區域,並生成10,000個隨機地理座標。你可能會問,為什麼是一萬個?因為科學!
這樣在地理上的均勻分佈當然會使我們對城市的看法有一定意見,因為大多數時候我們在樹林裡或者屋頂上都幾乎看不到任何東西。但幸運的是,在Google Maps API的幫助下,我們可以任意移動座標,並得到更像這樣的東西:
正如你所看到的,我們計畫訪問的位置(紅點)或多或少在熱鬧的道路和街道上,而不是一些長滿了樹的地方。
現在我們已經擁有我們的位置,現在是時候進入觀看位了,並熟悉Google街景視圖圖像API。基本上我用我的座標調用他們的API,並在本地保存生成的圖像。
經過一些反向地理編碼和一些常規遵循後,Google的API讓我得到了每個座標返回的照片(而均勻分佈則會顯示的“對不起,我們沒有圖像”)。
然後通過我的代碼,我就可以窺視成千上萬的Tartu的圖像,而不需要離開房間(或我的電腦?)。
圖像HAL層上有什麼?為了簡化事情,我通過公共可用的機器視覺API運行我們的圖像集。 我們有很多這種類似的選擇,比如Microsoft Computer Vision API / Google Cloud Vision API / IBM Vision Recognition API / Cloud / Sight API / Clarifai等等
但為了這個例子,我去了微軟的牛津項目。微軟研究組織使我印象深刻,老實說,他們的API免費使用條款是最吸引我的。他們甚至慷慨到提供Python 的快速開始代碼。
實質上,您只需將圖片上傳到其API,並返回一行描述場景的文本。這裡有一個來自Tartu的圖像示例,以及來自MS Vision API的輸出文本。
智慧壓縮通過他們的API,我將來自Tartu的8.5GB原始圖像圖元資料壓縮成255KB的文本資料。 如果研究過壓縮和智慧的關係,那麼這個減小了35,294倍的尺寸或許能說明一些問題。
無論如何,現在我們終於有了描述場景的自然語言,我們可以開始研究統計資料,看看我們能否找到一些說服某人搬家的理由。
看著那長長的列表,我幾乎睡著了,直到我看到“摩托車”這個詞。摩托車的數量或者人口中擁有摩托車的比例很好的說明了一座城市的潛力。我個人對此非常有共鳴(因為我擁有兩輛摩托車)。
當然,在各個城市尋找關於摩托車的統計資料還是會有很多來源,但是要記住,這些來自不同國家的不同來源的資料需要我們花費大量的工作去抓取以及進行規範化。Google街景的美妙之處就在於它將大城市作為了單個資料來源,並且能在捕獲圖像中可見的任何資訊。
AI的進步,更具體來說,深度神經網路的進步每週都讓我們感到驚訝,如果你依然懷疑AI技術在圖像中提取資訊的能力不如人類的話,那麼請參考一下下列AI擊敗人類的成果列表:
Google的AlphaGo擊敗李世石 卡內基梅隆人工智慧擊敗頂級職業撲克選手 微軟AI在語音辨識方面擊敗人類當然了,摩托車只是我個人關心的用於打趣的所舉的一個例子,但不難想像,在人類可見(或者也許是不可見的)的圖像中提取任何知識。潛藏在Google捕捉來的數百萬張圖片背後,卻有很多線索來描述著這些城市的生活品質。
這裡有一個快速健全的檢查方法,去檢驗我們知道的某些事情到底是否真實。我們為阿姆斯特丹拍攝另外了一萬張圖片,並在圖片中標記計算自行車的出現情況:
不考慮人口密度(或實際計算每個圖像上有多少自行車),至少,直覺似乎被驗證了。從計算自行車的數量和在地圖上追溯兒童在建築物及社區塗鴉的情況,這個巨大的圖像資料印證了我們的移動動作是豐富眾多的。
遠離街道我們當然不可能對街上看到的一切都關心。有時你必須離開熱鬧的街道,來個越野。舉個例子,Tanel Pärnamaa在Teleport實習時做了一些工作,他從Flickr那裡拿到了一組公開地理標記的照片,並使用機器視覺標記來識別海灘。有趣的是,當機器視覺資料信號受限時,他發現了很多沙地高爾夫球場。
更甚者,隨著Planet再次發射的那88顆衛星進入軌道,我們又有了另一個驚人的可以讓AI技術進入的圖像源。這樣一來,資料量將呈指數增長,而我們對城市生活品質的理解也隨之增長。
選擇你的工作,選擇你的城市,選擇你的生活!我們的一個投資者說道:“電腦和互聯網的傳播將把工作分為兩類:告訴電腦做什麼的人,以及被電腦告知要做什麼的人。”
我看到我們站內一些在任者花了大價錢以捕獲那些可以用代碼完成的事情。而我卻相信,通過機器學習和眾包獲得的效率將為我們提供了巨大的競爭優勢,長遠來說,我渴望看到它將如何發揮作用。
同時,我要對那些更傾向於告訴電腦怎麼做的人們一些具挑戰性的事實:
如何在各地理區域分佈您的代理/探測器,同時使各種偏差實現最小化(由城市面積大小,人口密度等引起的) 為了促進公平的比較,應該如何規範化的捕捉城市地區的資料? 如何避免在近景中出現的重複計數? 如何在統計中減少天氣,季節,白天等的影響? 如何優化觀看角度,在每個座標中採樣或組合圖像以被運用到360度視圖中? 從圖像提取生活質量數據後,要如何構建/訓練這些特定目標的模型? 最後,那些從公共圖片捕捉來的資料也許與生活品質相互對應,並且也有可能影響你決定接下來要搬去哪兒?