Microsoft Cognitive Toolkit 原名 CNTK,是微軟去年開源的深度學習框架。
作為語音辨識領域聲名卓著的開發工具,Microsoft Cognitive Toolkit 具有相當不錯的可擴展性、速度和精確性。在海量資料上開發深度學習應用,它具備商用級別的穩定型,以及與主流程式設計語言與演算法的相容。
如今,它即將迎來新一代的 2.0 版本。
自從去年十月發佈 2.0 beta 版,微軟為 Microsoft Cognitive Toolkit 2.0 已陸續添加了超過 100 餘個新特性、升級以及漏洞修補。而近日雷鋒網獲知,
微軟在 GitHub 上放出了它的 RC1版,即第一個候選版本,標誌著內測階段已經完成。
我們離 Microsoft Cognitive Toolkit 2.0 的正式發佈又近了一步。
前天,微軟在博客表示:
“我們很高興地宣佈,微軟已經將 Microsoft Cognitive Toolkit 2.0 帶出內測階段,並在今天向大家公佈其第一個候選版本。該工具此前被稱為 CNTK,是一個針對深度學習的系統,用來加速諸如語音、圖像識別以及搜索相關性(search relevance)等領域的技術進步。並可運行于 CPU 或英偉達 GPU。Microsoft Cognitive Toolkit 既可本地運行,也可在雲端基於 Azure GPU 運行。
Microsoft Cognitive Toolkit 在一系列微軟產品中都有十分廣泛的應用。全世界範圍內有大規模深度學習部署需求的公司,對最新演算法、技術感興趣的學生,都是其用戶。自從 2016 年十月,我們已發佈了超過十個 beta 版本,涵蓋數百個新特性、性能提升和修補。”
主要升級
在 BrainScript 之外提供了更多 binding。2.0 版本把 Cognitive Toolkit 作為一個支援以下 binding 的演算法庫:
Python (versions 2.7, 3.4, and 3.5).
C++.
C#/.NET Managed.
Python 示例和教程(Jupyter Notebooks)
微軟充分認識到 Python 在深度學習領域的重要性,準備了一系列 Python 示例與教程(後者作為 Jupyter Notebooks 來執行)。請見:
Python Examples.
Python Tutorials (Jupyter Notebooks).
雷鋒網瞭解到,你也可以用 Cognitive Toolkit Docker Containers 來運行 Jupyter Notebooks 教程。
Layers
Layers 演算法庫得到了大幅升級。大量的通用“layers”已預定義,使編寫包含標準層級的簡單網路變得十分容易。
新的評估演算法庫
雷鋒網獲知,新的 Cognitive Toolkit 評估演算法庫在易用性和性能上被大幅升級。該演算法庫可被用於 Windows 和 Linux,使用 C++、Python、C# 其它 .NET 語言。
新特性列表
The ability to extend Cognitive Toolkit functions, learners, trainers and optimizers with your own algorithms in Python, C++.
Enhanced, built-in distributed readers for speech, image, and text deep learning tasks.
The ability to use TensorBoard visualizations from Cognitive toolkit! Read more here.
Pretrained models available for use.
Performance improvements.
Support of distributed scenarios in Python API. See more in the sections on distributed scenarios in the ConvNet and ResNet examples.
Support of Asynchronous Stochastic Gradient Descent (ASGD)/Hogwild! training parallelization support using Microsoft’s Parameter Server (Project Multiverso).
Support for training on one-hot and sparse arrays via NumPy.
Support of object recognition using Fast R-CNN algorithm.
Integration with NVIDIA NCCL, a stand-alone library of standard collective communication routines, such as all-gather, reduce, broadcast, etc., that have been optimized to achieve high bandwidth over PCIe. See how to enable NCCL in the Cognitive Toolkit Wiki.
Lambda rank and NDCG at 1 are accessible from Python for real this time.
Performance Profiler for BrainScript and Python.
Support in training session for cross validation and preservation of all checkpoints.
Github 地址:https://github.com/Microsoft/CNTK
via
microsoft
,
eweek