您的位置:首頁>手機>正文

科大訊飛胡鬱演講實錄:人工智慧是這個時代最偉大的魔法師

雷鋒網按:9月份錘子的發佈會結束後,科大訊飛股票應聲上漲,成為羅永浩相聲專場的最大贏家。

這其中有一些運氣的成分,但在這種運氣之前,訊飛已經做了很多鋪墊工作。科大訊飛在2014年就發佈了中國的人工智慧品牌“訊飛超腦”,在2015年,訊飛超腦在更自然的人機交互、更高效的知識管理和更智慧的推理學習上都有了很大的進步,經過2016年一年的努力,訊飛又帶了了什麼新的進展?

以下是科大訊飛輪值總裁胡郁在科大訊飛年度發佈會上的演講,雷鋒網有刪改。

人工智慧在將來的5到10年,就像我們現在的水、電和互聯網一樣,在我們的生活中成為我們的必需品。我們看到其實人工智慧已經要改變我們很多的方面,比如說我們人機對話模式,人與人之間交流的方式,出行的方式,教育、醫療,改變我們很多的方面,毫不誇張的說,人工智慧是這時代最偉大的魔法師。

今年,我們給大家帶來了什麼黑科技呢?下面就讓我們來一一呈現一下。

去年12月21號的(科大訊飛年度)發佈會上,我們發佈了在世界上具有引領作用的AIUI。人和機器的交互中最重要的一點是什麼?是輸入資訊。當你們要聊天的時候,你們第一個想到的是要輸入,在2010年,訊飛的第一次互聯網的發佈會上,我們就發佈了訊飛語音輸入法,從此引領了整個中國在手機輸入法方面潮流。在過去的6年過程中,我們可以看到我們的輸入法已經擁有了超過了4億的用戶,每個月月活超過了一個億。而且,我們現在也使我們在手機上(語音)輸入的速度達到了一個極致的速度——每分鐘400個字,而且最近我們的輸入的準確成功率已經達到97%——當然了,這不是我說的,這是我們今天在座的一位貴賓錘子科技的創始人羅永浩同志前段時間給大家親自展示的。

但是,我們將進入一個新的時代,我們進將進入物聯網時代,在萬物互聯的時代中,是不是還是所有的情況下,我們都可以在智慧手機上這樣輸入呢,手機是不是萬物互聯中間唯一的我們接觸到的終端呢?

其實我們可以看到,隨著我們進入到萬物互聯的時代,我們和電視機、智慧家電、車載產品、機器人、玩具之間面臨著許多新情況,比如說,我們在跑步的過程中我們需要和我們的耳機親密的交流,很多情況下我們甚至看不到螢幕;你跟你的機器人談的過程中,很多時候它是沒有螢幕的。更多的時候,我們不僅僅需要輸入文字,可能還需要輸入圖像。

那麼在萬物互聯的時代下,我們的輸入到底要發生什麼樣的變革呢?下一種可能到底是什麼樣的呢?

一、輸入法

下面就請我們擁有4億用戶的手機輸入法的產品經理大人,我們略顯羞澀的小帥哥翟吉博給大家展示一下在物聯網時代輸入的魅力,有請。

雷鋒網按:翟吉博登臺,演示了拍攝識別手寫的一段文字(原理是OCR,光學字元辨識),文字為“我現在有點緊張,發佈會結束後,我晚上請大家吃飯”,系統全部識別出來了;並且通過手勢識別等體感技術在“晚飯”前添加了時間。

接下來完成了一大段語音輸入,並且通過語音去精准修改了其中一部分內容。在改動其中一個人名之後,系統自動把其餘地方出現過的人名也作了修正。

那麼讓我們來看一下剛才在我們展示的萬物互聯輸入法過程中,我們到底用了哪些的核心技術?首先得益於我們訊飛在世界上最領先的離線手寫輸入的引擎,我們現在可以讓各種各樣的智慧設備識別我們手寫下的文字,同時,在沒有觸控式螢幕的情況下,用上帝賜給我們的自然的雙手,完成了我們完整的輸入過程,再結合上我們語音的輸入的快捷性,可以看到,在萬物互聯的時代,將來你面對你的電視機、機器人、玩具、VR設備,我們都可以採用這種方式實現我們輸入的功能。

二、語音轉文字

剛才我們看到了,其實,人工智慧改變了我們和機器之間的交互,特別是輸入,那麼機器人工智慧,將怎麼改變我們人和人之間的交流呢?我相信大家在這場發佈會上全程都已經注意到了,自去年12月21號,我們首次在國際上展示了我們同屏的語音轉文字的技術以後,應該講這幾年來我們發展非常快。

最新一年,我們又取得了哪些進展呢?我們可以看到在這個過程中,我們的輸入的準確率應該講更高了,我們的輸入的反應速度更快了,不知道大家要注意到沒有,在跟前一年的相比,我們整個字(符)出現的時間要比原來更便捷,線上的這種情況下那麼我們的系統可以達到97%的正確率,在離線的機器上現在也能做到95%,應該講這是一個非常高效的系統。

那麼不僅僅在系統性能上,我們得到了很大的提高,針對不同的行業我們做了大量的定制工作,大家在螢幕上看到的一種是可以直接裝在您的會議系統機架上的專業的工控機,它不僅僅可以提供會議記錄的功能,而且它能夠對話角色自動的進行分離;另外一種,就是我們在外出辦公的時候用的一個可擕式專用聽寫筆記型電腦,那麼現在你帶著他可以實現會議紀要的及時出稿。

我們在很多的行業進行了深度的定制,舉個例子,在公安司法方面,那麼我們跟最高法進行了深度的合作,那麼現在的庭審記錄用我們這套系統可以極大地提高庭審效率,那麼我們可以把整個庭審的效率提高30%以上,原來做一項庭審需要3個小時的時間來處理庭審結果,現在只需要5分鐘;原來一個上午能處理3個案件,現在一個上午能處理5到6個案件,應該講極大的提高了效率。現在包括中央辦公廳、國務院辦公廳、最高法、最高檢和中央宣傳部都採用了我們的會議聽見系統,類似這樣的定制的系統已經越來越多的用在這各種各方面的行業用上。

三、翻譯

今年我們還有一個非常大的變化,所有的聽寫的結果是為了便於大家之間的交流,那麼我們的交流不建議於在我們中國的國內這些同志之間,國際友人間也非常需要交流,在我們出國旅遊的時候,我們要需要即時地和國際的友人進行交流,那麼今天我們也帶來了科大訊飛的一個真正的黑科技,給你一個小型的設備,你就可以隨時利用科大訊飛的聽見便攜翻譯機和我們的國際友人進行互譯,現在支持中英維三語。我們請一位漂亮的國際友人上臺和我們一起分享一下,這個創新性產品的精彩之處。

雷鋒網按:胡郁和一位國際友人在分別講中文和英文的情況下完成了對話,他們手中的小型設備可以即時地把胡郁的中文翻譯成英文,又把對方的英文翻譯成中文,速度很快,幾乎沒有什麼延時。

4月26號,習近平總書記去視察特大訊飛的過程中還專門的鼓勵我們要真正能夠把語音翻譯做到一帶一路和我們海上絲綢之路的建設中間去,那麼現在我也高興地告訴大家,作為安徽省援疆項目的一個重點,現在我們的中維的翻譯系統已經非常好的服務於我們現在很多援疆幹部與現場的維族同胞之間的交流上。

告訴大家一個好消息,經過這麼多年的發展,我們也推出了訊飛的即時的網上的服務系統,通過網站和APP的形式給大家來提供服務,大家只要把你的各種格式的語音音訊檔案傳輸到我們的網站或者APP上,你就可以得到精確準確的文字結果,而且它後面還提供人工服務的功能——對於一些品質確實有很大問題,短時間內機器解決不了的錄音,我們也可以用人工種包的服務幫你來解決。我們相信,那麼通過訊飛聽見,我們所聽既所見,而且讓我們的溝通無國界。

四、智慧家居

這兩年特別熱的一個概念是什麼?智能家居。我們去年推出了AIUI,使智慧家居的這種設備更好的能夠與我們進行交互,我們已經有超過3000家的合作夥伴,這3000多家廠商已經推出了1000多種各種各樣的產品,有檯燈,有機器人,也有智慧家電,有各種各樣的設備,在這個過程中,最重要的是電視,可以看到在訊飛推出電視的這個產品——我們叫訊飛電視助理,現在已經佔據了整個市場80%以上的市場份額,所有的著名的電視品牌的廠商,包括我們的機上盒廠商,包括我們的運營商和廣電,都與我們建立了非常緊密的合作關係。

我們剛才提到的交互技術融匯了我們多年以來在這個領域深度的一種積累,我們可以看到語音的識別率已經超過了97%,而且關鍵是它回應速度,很多人一開始看到這演示的時候,會說整個的識別和處理是不是就在機上盒上進行,但是我可以非常確定告訴大家:整個過程都是在我們的雲端進行處理的。更加神奇的地方,大家可能注意到了,不管是對其中電影名還是演員還是其中各種細化的內容,我們的語音都可以進行緊密的結合(雷鋒網按:比如這首歌很好聽,叫什麼名字;我要看“今年”的喜劇電影),這其實給我們揭示了將來語音搜索的一種概念,那麼針對家庭場景的語義,我們做了將近1萬種的各種不同的設計,而且它還在不斷持續增長過程中。

大家都知道,我們所有人在用智慧設備過程中,不是為了體驗,而是使用語音操作,我們不是為了便捷,我們是為了享受後面的不斷的資源、服務,還有各種各種的應用,那麼現在的整個訊飛的電視語音助手,有非常豐富的應用和海量的內容,它不僅僅可以檢索後臺的上千萬部的剛才看到的影片,還可以對接到我們現在的商城,可以在上面進行購物,甚至你可以在上面叫一個肯德基,這一切都為我們將來自然的家庭生活打開了一個新的視窗,可以看到電視機只是一個展示類型而已,那麼將來我們在智慧家居裡面,我們在VR上,我們在各種各樣的智慧家電,都可以實現類似剛才的操作,可以說,我們的智慧家庭不僅更懂你,而且更懂生活。

五、自動駕駛

剛才講過了,智慧家電是我們生活中一個非常必備的情況,但是,最近最熱的是什麼,也是我們中國人現在富起來的標誌,就是我們的汽車,我記得我在2004年去德國的柏林的時候,我非常驚訝于德國柏林滿頭整個街上都是大大小小汽車,但是現在我們看可以看到,我們中國的汽車只會更大,不會更小,只會更多,不會更少,但是當前的汽車其實也面臨很大的變革,共用經濟、鋰電池和新能源電池給,尤其是自動駕駛,為我們汽車帶來了更多智慧更多機器人的感覺。

但是有一天,李德毅院士曾經跟我說過說,如果有一天,我們的汽車都自動駕駛了,以上去以後它自動就開了,默無聲息,你不會覺得瘮的慌嗎?我後來一想確實很有道理,那麼,汽車是不是應該跟我們進行交流呢?如果你上一輛自動駕駛汽車,它說hi,今天你要去哪裡?也許這樣的感覺更好,那麼在過去的10年過程中,我們用我們的智慧語音技術,和很多的汽車廠商建立了非常緊密的聯繫,特別是科大訊飛的AIUI發佈以後,現在全世界有30多個國內外廠商和我們建立聯繫,超過100個車型現在正在用我們的訊飛語音交互技術。

那麼在這些過程中,最近3年包括賓士、雷克薩斯、大眾、通用,他們都在世界上進行了關於中文的語音交互的這麼一個測試,每一次科大訊飛都能夠拔得頭籌。在這個基礎上我們瞄準了汽車裡面的應用,我們最新推出了基於AIUI的車載交互系統飛魚,它有一些非常突出的功能,第一個就是降噪,所以我們現場沒有汽車的雜訊,但是,我們可以看到在已裝機的上百萬台的車裡面,我們都提供了非常高品質的語音辨識的效果,所有的過程都是非常的自然,不需要再去按鍵,或者是口頭的打斷,如果你想打斷汽車的說話,隨時可以,這就讓我們有非常自然的用戶體驗。更加重要的是我們在整個全場景上進行了深度的整合,相比去年我們的AIUI的系統我們可以看到今年,我們車載系統跟系統的深度整合又上了一個新的臺階,圍繞在車載環境下的主要的8項功能:包括智慧導航、線上娛樂、故障提醒、車身控制,所有的這些功能都進入了深入的調整,針對我們現在整理出來的100多項的汽車生活的場景和500多項的汽車業務屬性,我們進行了多達5000多種不同參數的語義層面的整合。

我們在各個方面包括我們的知識圖譜方面的工作很好地支撐我們和各種業務上的這種標誌性單元,這種概念的融合的處理,這也標誌著我們的深度神經網路用於自然源處理其實達到一個非常高的高度。我們剛才在家庭裡面看到的一樣,那麼其實,我們的飛魚助理不僅僅是為了讓你體驗這種美好的用戶感覺的,更重要的是我們在車裡面到底需要什麼?為了讓我們的車裡的生活更加豐富多彩,我們和中國移動、網易、攜程、大眾點評、美團建立了深度的連接,在你在車裡面可以隨時誰地用這些服務。

六、機器人

那麼應該說剛才,在慶峰的報告中也提到了我們的工作正在越來越多的被機器人所代替,那麼這兩年我相信一個最熱的領域是機器人領域。我有一個好消息和一個壞消息,好消息是我們不斷的用我們的技術促進了我們現在服務機器人在語音交互方面的能力,相信在座的今天來的各個機器人創業公司小夥伴一定非常高興。那麼壞消息是什麼呢?壞消息就是,根據德勤的分析報告,我們的越來越多的工作機會將會被機器人所代替,這已經是個不可逆轉的發展趨勢,那麼現在的科大訊飛的AIUI系統已經支援超過3000家的合作夥伴,各種各樣的活動夥伴,他們用我們的語音交互在各種各樣的服務裡面進行合作,但是我要提醒大家的是所有的服務機器人都需要一個客戶服務的功能

在過去的十幾年過程中,我們語音最大的一個應用就是用在客戶服務,大家已經感覺到越來越多的銀行、電信,他們後臺的呼叫中心已經被替換成機器自動服務,在過去的十幾年過程中,我們可以看到科大訊飛針對1萬種的語音自動服務的產品進行了優化,而且我們現在已經佔領了80%以上的市場份額,每日接聽電話的數量達到了200萬次,並且我們還節省了25%的人力開銷,那麼利用這種非常先進的客戶服務的能力,跟我們剛才講到的AIUI的系統和各種智慧服務機器人的元件進行結合,我們也推出了最新的服務機器人:營業廳服務機器人,就是我們的曉曼騎士。

不要看曉曼機器人這個名字裡面有個小字,他的名頭可挺大的,在4月26號,他也受到了習近平總書記的親自接見。這是我們打造的一個服務機器人的標杆,它能夠給你進行自由的對話,它能夠識別你的身份。在核心技術方面,科大訊飛已經用我們自身的技術力量和整合力量,為所有的服務機器人能夠提供一個很好的交互平臺;在管道方面,因為科大訊飛在銀行、運營商、教育領域有非常強的管道,我們也非常樂意和我們的機器人的合作夥伴一起為各種各樣的場景打造不同形態的機器人;在資本層面,科大訊飛其實也在進行一些戰略方面的佈局和投資,已經和政府層面上進行聯合的戰略佈局。

我們相信,將來的大家還注意到,其實我們的展臺上也有各種各樣形式的機器人,我相信將來我們在不同場合我們所需要的機器的形態是完全不一樣的,俗話說蘿蔔青菜各有所愛,每一個人,每一個單位都能夠找到自己最心儀的機器人的形態,那麼我們堅定地相信,科大訊飛一定能為每一個機器人,提供一顆AIUI的大腦。

七、教育

那麼講完了機器人,我們回到我們主要的一些運營的行業,教育。去年我們12月21號的發佈會上,我們發佈了訊飛超腦在認知計算,在自動閱卷方面的進展以後,最近一年,我們應該講好訊連連,首先看一下英文的作文,我們都知道原來傳統英文老師,因為作業非常難以批改,一般一個月才佈置一次,而且每一次他只能給你一個分數,並不能給你細緻的指出英文作文裡面有哪些點你做的事不好的,但是利用我們訊飛超腦的自動作文評閱系統,我們現在可以對不同的類型的錯誤都能給你指出來,而且給你一個精確的評分。對於中文其實也是一樣的,那麼對於中文的作文,我們也可以把裡面詳細的內容,都給你指出來。

這個教育系統的表現形式很多樣,但是總體的原則就是通過在學習過程中採集資訊,對學生的學習狀況進行自動化評測,分析盲點弱點,從而做個性化的題庫推送給學生,獲得因材施教的結果。這樣一來,教學的銷量提高30%,學生作業負擔下降40%。我們和很多學校都達成了合作。

我們可以看到,聲音將會帶來我們的生活帶來不一樣的感覺,每一天的變化都會促進變革。

科大訊飛的使命就是讓機器能聽會說、能理解會思考,板凳能坐十年冷,厚積薄發,我們希望能用中國的核心技術,結合中國現在的優勢,抓住國際產業變革的千載難逢的機會,用我們的技術和創業熱情,用人工智慧改變人類社會。

喜欢就按个赞吧!!!
点击关闭提示