1月29日上午消息,在過去數(shù)年中,Facebook將大量的資源都用在了聊天機器人(chatbot)的開發(fā)中。該公司在這個領(lǐng)域取得了一些進步,如今他們正在努力改進聊天機器人的對話交談能力。
雖然名為“聊天機器人”,但是它的對話技巧一直以來其實都不高。在最近的報告中,F(xiàn)acebook的研究人員指出聊天機器人的一些關(guān)鍵能力都需要得到提升。聊天機器人的第一個問題,就是這個人工智能產(chǎn)品缺乏連貫的個性。在一段對話中,他們難以保持貫穿始終的性格,從而讓用戶在使用時感到并不自然。
聊天機器人還有一個更讓用戶感到苦惱的問題,那就是它無法記住自己以往所做出的回應(yīng),也無法記住那些曾經(jīng)和它交流過的人,從而導致對話出現(xiàn)錯亂。最后,在被問到自己并不知道答案的問題時,這些聊天機器人總是使用那些預先編程好的回應(yīng)。
許多聊天機器人在進行訓練的時候,訓練人員使用的都是電影中的臺詞。而這種訓練方式很容易導致問題的產(chǎn)生,因為電影中的臺詞并不是自然對話,臺詞的用意是用來向觀眾暗示影片的角色的性格以及情節(jié)的進展。在訓練聊天機器人的時候使用這些材料,會讓聊天機器人在實際使用中無法呈現(xiàn)奇怪、甚至是無意義的回應(yīng)。
為了解決這些問題,F(xiàn)acebook的工程師自己構(gòu)建了數(shù)據(jù)集來訓練AI。這些數(shù)據(jù)集來自亞馬遜的Mechanical Turk線上市場,包含了超過16萬條對話。
這些數(shù)據(jù)最有意思的地方在于,它們并不是完全隨機的數(shù)據(jù)。據(jù)報道,為了給聊天機器人創(chuàng)建連貫的性格,亞馬遜的團隊甚至給旗下所有聊天機器人都創(chuàng)建了檔案。例如,其中一個聊天機器人對自己的描述為:“我是一個藝術(shù)家,我有4個孩子。我最近還養(yǎng)了一只貓。我喜歡散步,我喜歡看《權(quán)利的游戲》。”
現(xiàn)在,這些聊天機器人在對話方面離“以假亂真”還有很長的路要走,但是它們現(xiàn)在至少有了改進。