對于英語(yǔ)學(xué)習者來(lái)說(shuō),機器自動(dòng)批改作文技術(shù)已經(jīng)不再陌生,而全球人工智能專(zhuān)家們正在攻克更具挑戰性的堡壘——中文作文批改。
12月初,第六屆中文語(yǔ)法錯誤自動(dòng)診斷大賽(Chinese Grammatical Error Diagnosis,以下簡(jiǎn)稱(chēng)CGED)公布最終成績(jì),作為首次參賽的隊伍,有道AI自然語(yǔ)言處理(NLP)團隊在比賽中的語(yǔ)法糾錯Top3賽道斬獲冠軍,并且在另外兩個(gè)賽道(語(yǔ)法糾錯Top1、錯誤定位)位列前三,這也標志著(zhù)有道AI在中文作文批改上取得的又一重大進(jìn)展。
CGED大賽已經(jīng)走到第六年,比賽的方式是由計算機自動(dòng)對外國人寫(xiě)作的中文句子進(jìn)行錯誤的檢測和糾錯,分為檢測是否有錯誤、錯誤位置、錯誤類(lèi)型、糾錯等共計6個(gè)賽道。來(lái)自國內外14支團隊參與了今年的比賽。
英文語(yǔ)法錯誤診斷:有道已實(shí)現全面產(chǎn)品落地
AI作文批改技術(shù)在英語(yǔ)學(xué)習上的應用,網(wǎng)易有道早已實(shí)現落地。
2020年年中,網(wǎng)易有道將AI作文批改功能正式落地于網(wǎng)易有道詞典App,隨后在有道精品課初中英語(yǔ)秋季系統班中成功應用,用戶(hù)反饋良好。
近日,網(wǎng)易有道推出“有道寫(xiě)作”,將原有內嵌在網(wǎng)易有道詞典App的AI作文批改功能,延伸至網(wǎng)頁(yè)瀏覽器、Word插件、PC詞典等端口,滿(mǎn)足用戶(hù)的多場(chǎng)景使用需求。
AI作文批改受益于有道在神經(jīng)網(wǎng)絡(luò )機器翻譯任務(wù)上的多年數據積累和快速更迭的深度學(xué)習技術(shù),使用了基于Transformer架構的核心引擎,能夠對用戶(hù)的英語(yǔ)作文進(jìn)行評分、評語(yǔ)和糾錯,有效解決了不同年齡段英語(yǔ)學(xué)習者的自助學(xué)習的需求。
中文難于英文:語(yǔ)文作文批改面臨更高技術(shù)壁壘
相比于英文,中文語(yǔ)法糾錯任務(wù)的研究還較為早期,無(wú)論是任務(wù)本身的特點(diǎn),還是數據的積累都與英文有較大的差異。
一方面,中文字符連寫(xiě),傳統的語(yǔ)義理解及分析的方法基本上都需要依賴(lài)于分詞等前置處理模塊,而存在錯誤的文本會(huì )放大語(yǔ)言的歧義性,帶來(lái)基礎模塊識別質(zhì)量的下降;另一方面,中文的語(yǔ)法不像英文有較為嚴格的規則,相對更為隨意和復雜,不容易通過(guò)定義規則來(lái)處理。和英語(yǔ)語(yǔ)法糾錯任務(wù)相比,比賽方能夠提供的中文訓練數據是非常有限的,因此很難直接使用較為復雜的深度學(xué)習模型充分學(xué)習建模。
盡管有道AI團隊在智能批改糾錯方面有較長(cháng)時(shí)間的積累,該任務(wù)對技術(shù)團隊來(lái)說(shuō)仍然是不小的挑戰!
“人工智能只有通過(guò)積累足量的語(yǔ)料后,才可以理解復雜度高的語(yǔ)法錯誤,進(jìn)而才能作為產(chǎn)品功能落地!本W(wǎng)易有道首席科學(xué)家段亦濤表示,網(wǎng)易有道在教育和學(xué)習場(chǎng)景之下深耕多年,在OCR(光學(xué)字符識別)、NMT(神經(jīng)網(wǎng)絡(luò )翻譯)、語(yǔ)音識別技術(shù)等方面都已經(jīng)有良好的技術(shù)落地成果,且用戶(hù)口碑和體驗一直好評不斷。
機器批改作文:Precision(精確率)在工程實(shí)踐中更具意義
值得注意的是,有道AI團隊在本次比賽中的語(yǔ)法糾錯項目中,在CorrectionTop3和CorrectionTop1綜合指標(F1)分別獲得第1和第3名的情況下,對應的Precision(精確率)要明顯高于其他參賽隊伍。這在教育實(shí)踐場(chǎng)景當中對用戶(hù)體驗更為重要。
比賽綜合指標F1兼顧了Precision與Recall(召回率),作為模型精確率與召回率的一種調和平均。前者代表參賽系統給出的所有修改片段中,片段被正確修改的比例;后者代表在所有需要被正確修改的片段中,參賽系統修改的片段占的比例。
有道在Precision上的絕對領(lǐng)先,是源于有道AI寫(xiě)作助手的設計理念:錯誤的修改建議將誤導用戶(hù)進(jìn)行不正確的修改,從而大大影響用戶(hù)的體驗。而且,在用戶(hù)本身缺乏辨別能力的業(yè)務(wù)場(chǎng)景(如:低齡兒童的教育業(yè)務(wù))中,該問(wèn)題還會(huì )被進(jìn)一步放大。
因此,在英文語(yǔ)法糾錯任務(wù)(如:CoNLL-2014和BEA-2019英文語(yǔ)法糾錯任務(wù))中,通常會(huì )采用F0.5作為評價(jià)指標。該指標的計算方法與F1指標類(lèi)似,區別在于相比于Recall,該指標賦予了Precision更高的權重。
在CGED獲獎之前,網(wǎng)易有道曾試水了第七屆NLPCC中的“中文語(yǔ)法錯誤修正”共享任務(wù)比賽,斬獲冠軍。在技術(shù)優(yōu)勢積累、K12業(yè)務(wù)拓展的加持下,網(wǎng)易有道在語(yǔ)文作文修改領(lǐng)域的技術(shù)升級進(jìn)展飛速。
目前,網(wǎng)易有道的產(chǎn)品矩陣中已經(jīng)布局了不少針對CSL(以中文為第二語(yǔ)言)學(xué)習者的課程和應用。段亦濤表示,除了設計面向中文學(xué)習者的學(xué)習工具,未來(lái)網(wǎng)易有道還可以與中小學(xué)校合作,實(shí)現輔助老師進(jìn)行作文批改等功能,進(jìn)一步擴大有道AI技術(shù)在K12業(yè)務(wù)上的應用場(chǎng)景。