您所在的位置:紅商網(wǎng)·新零售陣線 >> 天下匯頻道 >> 正文
摘要翻譯、抄襲檢測……人工智能延伸科學交流觸角

  近日,一款看起來挺有文化的寫稿機器人上線了。它叫小柯,由中國科學報社和北京大學科研團隊共同研發(fā)。

  小柯寫的不是普通的稿子,而是中文科學新聞。據(jù)介紹,運用自然語言處理技術,小柯以英文論文摘要為基礎,能夠快速寫出中文科學新聞底稿,然后由專業(yè)人士和報社的編輯進行把關和信息完善,幫助科學家以中文方式快速獲取全球高水平英文論文中的最新科研進展。

  目前小柯的作品已經(jīng)上線。人工智能的觸角,也在伸向各個領域。

  小柯:一個盡職的摘要翻譯轉寫者

  科技日報記者發(fā)現(xiàn),7月5日,小柯機器人發(fā)出第一篇稿子,截至8月22日記者統(tǒng)計時,小柯機器人共發(fā)稿415篇。初期更新時間距論文發(fā)表時間間隔一個月左右,現(xiàn)在可以做到當天或隔天更新,每天更新幾篇到二十幾篇不等。所選論文來自生命科學等領域,涉及《自然》《細胞》《新英格蘭醫(yī)學雜志》等期刊。

  記者對照分析了小柯作品《單細胞測序揭示冠狀動脈疾病保護機制》及其英文原文。新聞中,小柯先對論文主題、研究單位以及發(fā)表期刊進行簡單介紹,后接英文原文摘要的翻譯,大致反映原文內(nèi)容;翻譯時會對原文進行適當?shù)恼Z句簡化,同時在對專業(yè)詞語的翻譯上也使用了如“血管平滑肌細胞”“保護性纖維帽”等專業(yè)表述。

  不過,這也不全是小柯的功勞,因為稿件發(fā)出前,還有人工審校這一步驟。北京大學計算機科學技術研究所研究員萬小軍團隊負責小柯的系統(tǒng)總體設計與聯(lián)合技術攻關。 他告訴科技日報記者,目前機器翻譯系統(tǒng)的性能很大程度上依賴于其所使用的訓練數(shù)據(jù),即平行語料。目前的平行語料多為新聞語料,因此訓練得到的機器翻譯模型對于日常新聞的翻譯效果較好。但學術文獻(比如生物學術論文)與日常新聞在用詞造句等方面都有較大差別,機器翻譯系統(tǒng)對于學術文獻翻譯的效果并不理想。

  這一次,他們通過融合領域知識進行語句智能篩選,選擇適合大眾理解的語句,并基于語句簡化提升語句翻譯質(zhì)量。“英文學術論文摘要適合專業(yè)科研人員閱讀,但摘要中的語句并不都適合寫到科學新聞中面向大眾傳播,因此需要結合編輯提供的先驗知識,采用計算機算法對語句進行篩選,保留適合進行大眾新聞傳播的語句。”萬小軍說。

  自然語言處理技術不只能讓機器人寫稿

  研發(fā)小柯用了半年時間,萬小軍表示,和一般寫稿機器人相比,一個好的跨語言科技新聞寫稿機器人需要進行兩次重要的信息轉換過程:一次是不同語言的轉換,將英文文本轉換為中文文本;另一次是語言風格的轉換,將學術型文字表達轉換為大眾能夠接受的通俗文字表達。“這兩次轉換都具有較大的挑戰(zhàn)性,目前并沒有完全解決。后續(xù)還需要進一步積累數(shù)據(jù),調(diào)整算法模型,才能取得更好的效果。”萬小軍說。

  接下來,團隊還將繼續(xù)優(yōu)化小柯,讓它寫出的科學新聞內(nèi)容更豐富,表達更生動。

  當然,翻譯撰寫科技新聞稿件,只是自然語言處理等人工智能技術在學術交流中所能大顯身手的領域之一。

2頁 [1] [2] 下一頁 

搜索更多: 人工智能

東治書院2024級易學文士班(第二屆)報名者必讀
『獨賈參考』:獨特視角,洞悉商業(yè)世相。
【耕菑草堂】巴山雜花土蜂蜜,愛家人,送親友,助養(yǎng)生
關注『書仙笙』:結茅深山讀仙經(jīng),擅闖人間迷煙火。
研究報告、榜單收錄、高管收錄、品牌收錄、企業(yè)通稿、行業(yè)會務
★★★你有買點,我有流量,勢必點石成金!★★★