科學匯 | 人工智能主要能在哪?機器人又是如何學會和人對話的?

錢江晚報·小時新聞記者 王慧華 通訊員 張海峰

據北青網報道,我國將在人工智能等前沿領域進行新興產業鏈布局。

開學伊始,記者也收到了一些同學的提問:現在在用的一些學習英語的人工智能產品真的是智能教學產品么?蘋果手機中的siri以及很多家庭中都有的天貓精靈,與智能化外語教學產品中的技術一樣嗎……

本期我們諮詢了我國知名人工智能專家、浙江省特聘專家、江蘇省產業教授朱奇峰博士。朱博士曾就讀於清華大學、中科院、美國加州大學洛杉磯分校、伯克利分校。他也是智能教學專家,曾擔任三個國家級信息化教育研究課題。他獨立研發了世界領先的人工智能語音技術並創辦了清睿教育,最引人注目的產品——“口語100智慧學習空間”和“智能聽說教練”在全國廣泛應用。此次他為大家帶來人工智能相關的解答。

人機對話,人工智能的標配之一

過去20年中,信息時代已跨越了數字化時代、雲技術時代、大數據時代,來到了人工智能時代。

我們其實可以從和同學們關聯更多的學習角度理解。每天,同學們都能用上與人工智能相關的產品,甚至在日常學習上,也會有很多體驗,比如語音識別、語音分析、語音合成、口語測評、圖像識別、手寫體識別、自然語言理解、人機對話、作文批改等等,並且新技術的水平都在不斷提升。

而我們每天都會接觸的這些教學產品,也經歷了“電子書包”和習題光盤、網絡多媒體學習內容、通過大數據分析的精準化分析建議和教學內容推送,直至如今的人工智能個性化互動訓練的階段。比如研發人員把多種人工智能技術應用在外語教學中後,也給學生帶來了全新並有效的訓練形式:擬人化智能互動語言能力訓練。

第一代信息化教學產品一般是傳統教學內容電子化,而智能化互動訓練是完全個性化的,針對學生說什麼,智能教學產品可以像真人一樣,能聽、能說、能看、能對話、能聊天、能評價能糾正,並且通過個性化智能互動提升學生語言能力。

不過同學們肯定更關注,這種新型的人工智能互動語言訓練,能對自己在外語學習等方面帶來多大幫助?

看了同學們的這些疑問和希望,我們也發現,人工智能設備最大的特點之一,就是可以和同學們進行交流,也就是我們常說的“人機對話”。

智能設備,是怎麼學會對話的

那麼人工智能是怎麼工作的呢?20多年來,人工智能的工作方式已經從專家系統、決策樹,發展到統計模型和最新的多層神經網絡模型——也稱為“深度學習”。這個深度學習和我們日常認為的深度學習完全不同,它指的是模擬大腦神經元連接方式的人工神經網絡的層數可能多達十幾層甚至上百層的大數據模型方法。

比如人機智能對話在教學應用中,就得首先用到語音識別技術。為了讓機器(智能老師)聽懂人話,研發人員需要收集幾萬小時甚至十幾萬小時的學生語音去“訓練”這個多層神經網絡模型。

10萬個小時的學生聲音需要多大的存儲呢?一分鐘的聲音大約需一兆字節的存儲,10萬小時的聲音需要6TB(6000G)的存儲空間,整個訓練過程需要多台計算機多個CPU和GPU並用,分布協同工作連續運行約一周時間。可以看出,機器學習是一個很消耗算力的工作。

除了使用語音識別技術,智能機器還得接受發音分析技術的訓練。

在這個任務中機器已經知道學生說了什麼,然後需要判斷學生說的是不是和標準的聲音相似。語音識別任務的目標是為了容忍並聽懂各種糟糕發音,而發音分析是為了挑出發音中的問題。這個貌似簡單的任務其實很不簡單——人可以輕鬆地把一個女孩兒說的A和一個成年男性說的A判斷為“發音相同”,聰明地忽略他們因為性別、年齡差別對聲音其實帶來的巨大不同,但這對機器智能是一個挑戰。

在各種智能互動訓練任務中,語音合成技術也起到了重要的作用。有了這個技術,計算機才能對人說話,不僅避免同學們總是看屏幕文字,而且互動更加自然,也保護了視力。語音合成技術的背後可以使用不同的技術方案,包括波形拼接技術:直接錄下一個人在錄音棚里朗讀的聲音,存儲為一個幾十兆或者幾百兆的包含了不同上下文的聲音波形倉庫,然後就可以根據合成任務的需要尋找正確的上下文波形進行拼接;還可以使用“聲道參數模型”,在計算機內部模擬出氣流通過聲帶振動和發音器官產生出最後語音波形的過程。這個方法不需要直接存儲聲音,但需要從聲音中分析出這個人的發音器官的聲道模型。

思考題

同學們在很多科幻電影中,肯定看到過未來世界中無所不在的人工智能,而且比人類現在能想象的更聰明,甚至會產生自主意識和情感。但這一切會發生嗎?

其實,人工智能實際並沒那麼聰明,但做到了“勤能補拙”:通過算力的加強和勤奮的大數據學習,計算機可以趕上甚至超過人類。

不過,舉個簡單的例子:人類的小孩看見幾隻貓就能學會貓是什麼,計算機要學會貓是什麼可能要看成百上千隻貓。可見,人類的學習方法本身還是有自己獨特和高效之處。

今天,人類剛剛步入人工智能時代的門檻。但可以預見的是,人工智能技術最終也將要為人類服務。如今,製作優秀的智能教學產品需要使用多種人工智能技術,每一項技術又可以根據不同的應用目標採用不同的技術方案。所以說,未來人工智能技術的發展和研發需要大量的人才。不知同學們是否也願意在未來加入進來呢?

這次,朱奇峰博士也為同學們出了兩道開放式的思考題,歡迎大家掃左側二維碼後,在文章留言區踴躍留言互動,並標註姓名、聯繫方式和快遞收件地址。我們將在留言區評選100位優秀留言者,給予精美小禮品贈送——

想一想

1. 你怎麼看待互動語言訓練對於外語學習的重要性?

2. 你認為智能互動語言訓練最大的優點是什麼?最大的缺點是什麼?

本文為錢江晚報原創作品,未經許可,禁止轉載、複製、摘編、改寫及進行網絡傳播等一切作品版權使用行為,否則本報將循司法途徑追究侵權人的法律責任。

來源:錢江晚報·小時新聞