人無時不刻不在呼吸,而動輒爆表的 PM2.5,掙扎的霧霾讓我們不禁憂慮起自身的健康來。
在一年以前,IBM 研究院推出了 Green Horizon項目,雷鋒網此前也做過報導。Green Horizon 利用IBM的機器學習技術及物聯網技術(IoT),從大資料中挖掘從天氣到污染指數的一系列海量資訊,以反復的反覆運算及自我調整的調整系統,鍛造出世界上最為精確的能源和環境預測系統。
IBM 首先把試點城市選在了南非的約翰尼斯堡,與當地的研究機構進行協作。面對不斷惡化的大氣環境及氣候變化,它們又會做出怎樣的嘗試呢?日前,駐該機構的 IBM 科學家 Tapiwa Chiwewe 與 IBM的 Chris Sciacca 進行了一次訪談,雷鋒網摘編如下,未經許可不得轉載。
Tapiwa Chiwewe
Chris Sciacca(下稱 Sciacca):
目前這個環境預測系統進行到了怎樣的階段?
Tapiwa Chiwewe(下稱 TC):
此前試點城市能夠成功預測明天的環境狀況,不過經過我們的努力,能夠將這一時間延長到七天。
Sciacca:
那麼,這個預測系統目前達到了怎樣的精度?
TC:
現在能夠達到 10 km*10 km 的空間分佈率,而如果能增加更多的計算源,這一數字還能提升到 1 km*1 km 的高解析度。
Sciacca:
如果要用預測結果做決策,精度要達到怎樣的水準?
TC:
如果這些判斷要用於決策的話,準確度能達到 70% 以上(包括一些明顯的、肉眼可排除的錯誤)就可以稱得上是很不錯的結果了。而預測污染指數為環境提供公共預警信號肯定是大有裨益。
Sciacca:
我們都知道,在一天內或者一個地點中污染物的數量不可避免地會存在一定波動,那麼這一數字與預測結果相比存在多少誤差?
TC:
污染情況的波動取決於特定的天氣狀況。一些會造成強烈影響的天氣狀況(如強風、降雨、低氣壓等)能夠在幾個小時內迅速改變污染指數。而空氣品質的預測主要借助的是天氣模型來捕獲上述容易影響污染狀況的資訊並做出調整,因此誤差的規模就會減小很多。
Sciacca:
目前階段及未來,我們是否能準確判斷污染源?
TC:
污染源對於預測系統而言是另一個全新的命題,因為它需要對每個污染源進行判斷,包括直接排放量、天氣影響,伴隨化學反應產生的二次污染等。
我們實際上可以追蹤污染源來自什麼樣的地點。但它需要大量的資料來源模型,且不能包含目前的試點。不過它可能是未來商業化的一個變現手段。另外,風是一個比較簡單的判斷因素,如果我們只考慮污染物的飄散狀況,這個模型就會相對簡單。
Sciacca:
要讓這個系統順利運轉,我們需要什麼樣的支援?
TC:
即時感測器的資料當然必不可少。日常的天氣預測可以以三天為界,並通過線上網站進行分析與整合。
Sciacca:
TC:
資料來源於三個南非的空氣監測網路,為約翰尼斯堡、Thswane及瓦爾河監測中心。在三個網路點間,有 21 個監測站,按照南非空氣品質資料中心的要求收集資料。我們準備將這一功能增加到 IBM 的 The Weather Company 商業計畫中。
Sciacca:
是否能為我們解釋一下採用 PM10、PM2.5和二氧化氮這三個指標的原因?可否簡單理解為,這三項為最“簡單粗暴”的判斷標準?
TC:
在監測之時,那些容易對人類、野生動植物及環境的健康造成影響的污染物自然首當其衝。南非通常每五年就會重新制定一次空氣品質管制計畫,明確首要關注的污染物,考慮所可能造成的危害,對干預策略的有效性進行判斷,以控制空氣污染。
Sciacca:
約翰尼斯堡的哪些資訊能夠作為資料來源?
TC:
資料的品質會以多種形式從不同網站收集,包括讀數記錄、採樣間隔的時間、還有讀數的準確性。這些都受監測站設備維護狀況的影響。
Sciacca:
後續將有什麼研究計畫?
TC:
除了收集更多的資料,我們計畫推出API,開發人員能夠基於此創建為消費者和企業使用的應用程式。
如果你對他的研究感興趣,歡迎閱讀他的論文:
Machine Learning Based Estimation of Ozone Using Spatio-Temporal Data from Air Quality Monitoring Stations
推薦閱讀:
IBM如何利用大資料來説明中心城市對抗空氣污染?
深度 | 從紐約到灣區,73歲的 IBM 憑藉 Watson 一路向西