淘新聞

想知道 GitHub 上各開源項目的生存狀況如何?這個軟體告訴你!

雷鋒網消息:今日淩晨,DataScience Inc. 發佈了 DataScience Trends。

這是一個針對 GitHub 資源庫的互動式資料分析與視覺化工具,能方便地對各開源演算法庫的活動、狀態、人氣進行比對

,包括新 commits 和 pull requests。開發者可用它來考察開源專案大趨勢,以及篩選感興趣的項目。順便說一句,它免費使用。

它基於 GitHub 和穀歌去年公開的 3TB GitHub 專案資料。

據雷鋒網瞭解,操作它不需要寫代碼,介面簡潔。因此,即便是新手也能輕鬆使用,用它來挖掘 GitHub 專案資訊,在時間軸上與趨勢進行交互。另外,資料範圍也可任意調節。

DataScience Inc. CTO William Mercha 表示:

“當下,正是開源工具不斷蠶食有償解決方案市場空間的時候。

使用 DataScience Trends 挖掘出的開源專案資訊,對於需要找到合適開源軟體的開發團隊非常寶貴。

去年在 Burtch Works 的市場調查中,有 62% 的資料分析從業者表示,相比經典解決方案 SAS,他們更傾向於使用開來源語言 Python 和 R。在企業級領域,這是一個市場大趨勢。

在 GitHub 文檔裡,有許多可探索的領域。比如某個資源庫的熱門程度(從星標數量、書簽收藏數量獲知) ,還有開源工具集的合作(從 pull requests 看出)。

我們使用 DataScience Trends 來尋找最受歡迎的開源工具,然後把它們整合入我們的企業平臺 DataScience Cloud。比如,我們通過 DataScience Trends 能清楚看出,TensorFlow 刺激了開發者對與之相容的神經網路庫 Keras 的興趣;還有,資料視覺化工具 ggplot 在 Python 開發者群體中的影響力不斷壯大。隨著 GitHub 的存檔不斷增長,DataScience Trends 用戶能夠挖掘出更多的有價值資訊。“

由於資料集多達 3 TB,DataScience Trends 帶來的探索可能性幾乎是無限的。

它覆蓋了一萬個最熱門 GitHub 資源庫的資料,包含專案開發活動、流行程度、合作等方面的資訊。

此外,DataScience Trends 還內置了其它幾項功能,以方便探索開源軟體資料:

具體日期與數值

使用者可利用任意資料視覺化方法,來觀察某一日期節點的資料與數值。

標準化的比較趨勢

任意大小、任意流行度的演算法庫,可通過一個通用檢索框架來進行比較。只需一次點擊,就能從“相對”視圖返回到“絕對值”視圖。

共用功能

每次探索都會生成一個獨立的 URL。當然,使用者也可點擊“共用”圖示。

更多請訪問 DataScience Trends 官網:

https://www.datascience.com/resources/tools/trends

雷鋒網提醒,下載需提交使用申請。

via 

kdnuggets