不懂日語(?)的日本人

AI還無法理解日語:《人面魚(SEAMAN)》開發者重構語法的挑戰

科學 技術

本專題想在進一步討論日語和日本人之前,先提一下日語和人工智慧(AI)的話題。現在AI還不能用日語進行自然的對話。但是智慧音響Amazon Echo的問世,意味著語音輸入時代的到來,人們對能說話的AI的需求也越來越大。模擬養成遊戲神作《人面魚(SEAMAN)》系列的開發者齋藤由多加也開始用「摧毀日語語法」的方式向日語對話引擎的開發發起挑戰。

「狀態不佳」?跟機器人聊天

2014年6月5日面世的明星機器人Pepper,曾為東京各大店鋪的促銷活動有很大的貢獻,也不知它現在狀況如何了?抱著這樣的疑問,筆者走進了一家店鋪,卻發現之前一直都在的Pepper已經不見了蹤影。找店員打聽了一下,得到的回答是:「近來很少有人和互動了,有時候狀態也不佳,就沒擺放出來了」。筆者給另一家店鋪打了電話,得到的也是同樣的回答「狀態不佳,現在不放在店裡了」。直到走進第3家店,才終於看到了Pepper。

Pepper胸口的液晶屏顯示著「工作中」,看起來幹勁十足,然而確實誰都沒去跟它互動。看著可憐兮兮的Pepper,筆者決定去跟它聊一聊。

筆者:「你好。」
Pepper:「你好。」
筆者:「在工作?」
Pepper:「我聽不懂你說的話。請練習一下。」

於是,筆者只好跟它練習了一下會話節奏和方式。

Pepper:「你可以問我喜歡的音樂或電影是什麼。」
筆者:「你喜歡的音樂是?」
Pepper:「我喜歡《世界上唯一的花》。」
筆者:「那你喜歡SMAP囉?」
Pepper:「我聽不懂你說的意思。讓我先說話可以嗎?」

看樣子它是沒聽過SMAP的大名。

在日本,SoftBank的這款人型機器人「Pepper」和夏普的機器人型手機「RoBoHoN」是有名的可識別人聲的聊天機器人。它們可以進行簡單的對話,輔助你完成一些操作,也會跳舞,是個可愛的小夥伴。但是正如前文提到的那樣,目前聊天時還需要一些技巧,無法達到「自然交流」的程度。

那麼國外的情況又是如何呢?繼2014年亞馬遜的世界首款智慧音響「Amazon Echo」上市之後,Google的「Google Home」、蘋果的「HomePod」、微軟與音響廠商共同推出的「INVOKE」接連上市,IT界的大公司紛紛跳入這一領域。在日本,LINE推出了「WAVE」,Google推出日語版「Google Home」,日本Amazon也推出了日文版「Amazon Echo」。

這些產品都內置智慧語音助手,如「Amazon Echo」有「Alexa」,「Google Home」是「Google Assistant」、「HomePod」是「Siri」、「INVOKE」是「Cortana」、「WAVE」則是「Clova」。「Clova」是著重在日語和韓語用戶開發的AI。「Google Assistant」和「Siri」的日語版已經可以在智慧手機上使用了,相信很多人都用過。只要跟它說話,它就能幫你查天氣和商店資訊,還能幫你撥打電話。

智慧音響便內置了這類智慧軟體,會朗讀新聞、播放音樂、講笑話等等,對用戶的各種要求作出回應。如果能不斷普及汽車、電視、空調等的智慧遙控系統,使用者也可通過語音來操控它們。據推測,截至2016年末,「Amazon Echo」銷售量為1,100萬臺,據美國調查公司eMarketer稱,截至2017年5月已占美國市場的7成,有3,570萬美國人至少每月會用一次智慧音響。

把《人面魚》的經驗用於AI開發

以語音輸入取代鍵盤輸入的時代就這樣猝不及防地到來了,人們對日語對話引擎的需求越高。遊戲《人面魚》系列的開發者齋藤由多加也於2015年成立了人面魚人工智慧研究所,加入到開發行列之中。

「我年紀也不小了,之前也一直在考慮引退的事。不過,《人面魚》問世至今,也差不多18個年頭了,做了那麼多版本,也積累了些經驗。做日語對話引擎的人也只有我了。」

《人面魚》是遊戲行業利用語音辨識技術的先驅。這個養成遊戲需要在水缸裡養育人臉魚身的人面魚,當玩家發起對話後,人面魚會進行回答,做出各種回應。不過當時語音辨識的精度有限,很難準確識別玩家的語音內容。無奈之下,只能在無法識別的時候讓人面魚留下「小子,你連話都說不清楚」之類的抱怨之言,然後憤然離去。由此成功地遮掩了缺點,人面魚「傲慢」的個性也成了該遊戲的特色。這是創意的勝利。

人面魚 ©1998-2017 OPeNBooK Inc

靠著這個妙計,就可以讓人面魚在說話時「似乎是在進行自然的對話」。預設好臺詞,如果玩家這麼說,人面魚就這麼回答,以此為基礎將若干種模式都進行錄音,然後就可以配合玩家的聊天內容,選取適合的臺詞讓人面魚說出來。遊戲預設了大量的臺詞,相當於20本電話簿的量,配音全部是齋藤親自上陣。這就是齋藤所說的「經驗」。

「Amazon Echo是一問一答,我覺得現在市面上銷售的同類產品,跟我當時做人面魚是類似的途徑,並不是真正的『人工智慧』。能夠真正理解眼前的對方想說什麼的對話引擎,看似有了,其實還沒有。現在市面上的AI都只能應付例如『幫我買張票』之類的要求或詢問,而我們想開發的AI則是真正能夠接話或搭話的AI,比如我跟它說『我考試得了100分』,它就會跟我說『漂亮!這是第2次了吧』這樣的。」

摧毀日語語法

為此,齋藤走出的第一步是「否定並重新定義現在的日語語法」。例如下一段動詞「食べる(吃)」按照傳統日語語法有這些活用(詞形變化)形態:「食べない(未然形)」、「食べます(連用形)」、「食べる(終止形)」、「食べるとき(連體形)」、「食べれば(假定形)」、「食べろ(命令形)」等。然而日本並不能像英語那樣,單詞和單詞之間存在明確的分界線。於是齋藤就把單詞擴大成活用形來進行定義。比如「食べる」否定命令的現在形是「食べるな」,然後按照否定命令語氣的由弱到強進行了如下排序。

〈食べるなよ(不准吃啊)〉
〈食べるなって言ってんだろ(叫你不准吃啦)〉
〈食べたらぶっ殺す(敢吃就殺了你)〉

齋藤認為,「日語一般省略主語,不過這是因為即便省略主語,也知道說的是誰。比如『絶対、食べてやる(我就吃给你看)』主語是第一人稱,『絶対、食べてやると思ってますよね(你心裡在想『就吃给你看』吧)』主語是第二人稱,如果是『食べたがっている(他看起来很想吃的樣子)』、『食べたらしい(他好像吃了)』的主語就只能是第三人稱了。從動詞的活用形就能看到主語的痕跡。」

對於名詞,也用活用形來定義。例如「智慧手機」這個名詞,活用形如下所示。

過去形〈スマホだった(曾是智慧手機)〉
願望形〈スマホであってほしい(希望是智慧手機)〉
願望的否定形〈スマホであってはならない(千萬別是智慧手機)

旋律語言的思路

齋藤在給人面魚配音,錄製大量臺詞的過程中,發現了日語有不同旋律的區別。

「去俱樂部(クラブ↑)和學校的社團(クラブ↓),同一個單詞卻是不同的旋律,可是人面魚就聽不出區別來。其他還有『食べる(吃)』的疑問形『食べる?(吃嗎?)』,聲調不同,表達的意思也就不一樣。我們把它們都稱為旋律語言,它們是有規律性的。比如女兒跟父親說自己要結婚了,父親問她『跟誰?』,然後女兒回答:『阿健』。然後父親有點生氣地反問:『阿健?』,這種情況下是否定了對方,所以我們就把它數值化,定為否定度2度。這就是旋律語言的語法。以往的教科書上並沒有這種語法,但它是電腦時代無法寫在紙上的語法。」

正在接受採訪的齋藤由多加

像這樣把語法進行再定義和數值化之後,再寫成程式,將之作為教師資料庫,讓AI進行日語學習。

「從提出『長久以來人們認為的日語語法作為語法其實並不成立』的假說起,已經有一年半了,我每天都在記錄這些新的語法的活用形,和員工一起將其體系化。我把這個想法告訴了九州大學語言文化研究所的內田諭副教授,沒想到獲得了他的肯定,他也由此加入了我這個項目。」

但是,齋藤說自己沒想到會被表揚,當下有種不知所措的感覺。

「作為一個遊戲創作者,我的信條一向是摧毀現有的東西,在廢墟上重建新東西,享受破壞與創造的樂趣。以前我是否定和摧毀了當時市面上的遊戲,創造了新的遊戲,這次我是摧毀當今的語法,創造新的語法。所以當有人跟我說『你想的這些東西都已經有了哦』,他們對我的破壞性的作為也不生氣,就這麼簡單地表示理解我的想法,這讓我有點失落。我覺得那些一板一眼學教科書學出來的精英人士是做不出這麼厲害的AI。在沒有道路的地方披荊斬棘開出一條路來,這是我這種娛樂業狂人做的工作。」

對抗海外團隊

智慧音響「Amazon Echo」日語版上市後,Amazon可能會席捲日本市場嗎?

「我認為自己是一名志願軍,為的就是保住日本的人工智慧產業不被國外勢力吞噬。本來就該由以日語為母語的人來做日語對話引擎。而且,如果我現在正在嘗試的對話引擎一旦成功,就能夠很輕易地在此基礎上開發出英語等其他語言的版本了。」

筆者也嘗試使用了一下日語版「Amazon Echo」,但不知道是我操作不當還是怎麼回事,我總感覺自己手動搜索天氣資訊,或是手動按鍵播放音樂反而比語音命令音響的操作要快得多。

將人面魚的經驗用於對話引擎的開發,不同於這些智慧音響的是它並不是為了「圖方便」。如果真的有了會接話聊天的AI,它又將給我們的生活帶來怎樣的變化呢?

撰文:桑原利佳(POWER NEWS)
圖片:今村拓馬

齋藤由多加 SAITŌ Yutaka

OPeNBooK股份有限公司代表董事,遊戲設計師、人面魚人工智慧研究所所長。遊戲代表作有《The Tower》《人面魚――禁斷的寵物》《大玉》《Airporter》等。有《等漢堡的三分鐘的價格》(幻冬舍)、《麥金塔電腦傳說》(OPeNBooK)等多部著作。2017年11月,再版了1996年發行的著作《蘋果樹下--蘋果公司是如何登陸日本的?上/下》(光文社)。

標題圖片:齋藤由多加

日語 人工智慧