新年結(jié)束后第一個(gè)工作周,第五屆中文句法錯(cuò)誤自動(dòng)檢測(cè)技術(shù)評(píng)測(cè)(ChineseGrammarti-calErrorDiagnosis,CGED)悄悄拉開(kāi)了戰(zhàn)幕,人工智能學(xué)術(shù)界和工業(yè)界的不少單位即將在“幫老外批漢語(yǔ)作文”這一任務(wù)上一較高下。據(jù)介紹今年評(píng)測(cè)活動(dòng)的競(jìng)爭(zhēng)將十分激烈。這多少也和去年年底的AI批改留學(xué)生作文的熱點(diǎn)事件有關(guān)。
2017年12月央視新聞一則《浙外引進(jìn)阿里AI批改作文,不到200字作文看出8處錯(cuò)誤》的新聞,引發(fā)各媒體關(guān)注和網(wǎng)友熱議。據(jù)報(bào)道,一些較為隱蔽的錯(cuò)誤點(diǎn),甚至有經(jīng)驗(yàn)的教師也無(wú)法立刻發(fā)現(xiàn)。
就像所有其他人工智能應(yīng)用一樣,一經(jīng)眾多媒體的宣傳,自動(dòng)作文批改就已經(jīng)開(kāi)始有點(diǎn)兒“威脅”漢語(yǔ)教師了。但查閱CGED技術(shù)評(píng)測(cè)的綜述論文可知,經(jīng)過(guò)超過(guò)五千個(gè)錯(cuò)誤點(diǎn)測(cè)試后,即使是2016年和2017年技術(shù)評(píng)測(cè)第一名(哈工大與阿里巴巴)識(shí)別錯(cuò)誤類型和錯(cuò)誤位置的綜合精度也都在40%以下。再加上留學(xué)生手寫作文掃描識(shí)別為數(shù)字化文本環(huán)節(jié)的差錯(cuò),錯(cuò)誤識(shí)別的綜合精度只會(huì)更低。另一方面,為了降低運(yùn)算難度,評(píng)測(cè)還將真實(shí)語(yǔ)言教學(xué)中的幾十種錯(cuò)誤標(biāo)記,歸并為了冗余、缺失、錯(cuò)用、亂序四種大錯(cuò)誤類型。由于評(píng)測(cè)中錯(cuò)誤劃分很粗,教師無(wú)法只通過(guò)錯(cuò)誤統(tǒng)計(jì)就準(zhǔn)確把握學(xué)生語(yǔ)言能力。總之,自動(dòng)批改距離投入教學(xué)前線還有很大的差距。
人工智能領(lǐng)域有句很有道理的笑話:人工智能,沒(méi)有人工就沒(méi)有智能。相比高考作文,漢語(yǔ)作為第二語(yǔ)言的寫作數(shù)據(jù)還較為稀缺。受教學(xué)模式、學(xué)習(xí)階段和母語(yǔ)的影響,留學(xué)生容易出現(xiàn)的語(yǔ)法錯(cuò)誤類型極富多樣性。今天在大多數(shù)人工智能應(yīng)用中取得輝煌戰(zhàn)績(jī)的深度神經(jīng)網(wǎng)絡(luò)模型,對(duì)數(shù)據(jù)規(guī)模和質(zhì)量的要求則更加苛刻。
目前,市場(chǎng)上較為成功的人工智能應(yīng)用大多都因?yàn)闃?gòu)建了“服務(wù)—用戶—數(shù)據(jù)”的正反饋閉環(huán),即通過(guò)智能服務(wù)擴(kuò)大用戶群體,大量用戶產(chǎn)生數(shù)據(jù),數(shù)據(jù)驅(qū)動(dòng)模型進(jìn)一步改進(jìn)服務(wù)效果。這就要求人工智能服務(wù)在先期必須達(dá)到用戶基本可以忍受的效果。而對(duì)于漢語(yǔ)作為第二語(yǔ)言的句法錯(cuò)誤檢測(cè)任務(wù),雖然已經(jīng)取得了不小的進(jìn)步,但還無(wú)法開(kāi)啟如導(dǎo)航、廣告推薦這樣的正反饋閉環(huán)。正如黎明之前的黑暗最難熬,推動(dòng)智能起飛之前的這段人工之路也最艱苦。但好在語(yǔ)言處理被視作人工智能皇冠上的明珠,越來(lái)越多的資本和人力都在不斷涌入,相信句法錯(cuò)誤檢測(cè)這樣的細(xì)分領(lǐng)域,在可預(yù)見(jiàn)的未來(lái)也能進(jìn)入飛速發(fā)展期。屆時(shí),教師省心、學(xué)生省力的批改機(jī)器人就不再只停留于展示中了。
另一方面,技術(shù)評(píng)測(cè)將助力技術(shù)發(fā)展。畢竟光說(shuō)不練假把式,在同一數(shù)據(jù)平臺(tái)上一較高下,方可刺激學(xué)界和業(yè)界苦練真功。期待今天還停留在展示和概念階段的AI能高速成長(zhǎng),為漢語(yǔ)國(guó)際傳播貢獻(xiàn)力量。