亚洲精品国产变态一区二区_国产激情精品在线观看_一二三四免费视频观看_丝袜美足论坛_国产真实乱在线视频更新_黄色a级毛片免费_少妇裸体淫交免费看片_少妇乳头视频看看

2027年要初步建立的“國家關(guān)鍵語料庫”是什么 怎么建

2027年要初步建立的“國家關(guān)鍵語料庫”是什么 怎么建

2025年05月26日 08:54 來源:中國青年報(bào)
大字體
小字體

  “當(dāng)前,隨著新一輪科技革命和產(chǎn)業(yè)變革,大語言模型、人工智能技術(shù)快速發(fā)展,語料庫的建設(shè)規(guī)模與應(yīng)用范圍也經(jīng)歷了大幅度完善和拓展?!鼻安痪茫逃空Z言文字信息管理司相關(guān)負(fù)責(zé)人提到,決定實(shí)施國家關(guān)鍵語料庫共建共享計(jì)劃,擴(kuò)展關(guān)鍵領(lǐng)域,支持共建共享,推進(jìn)應(yīng)用轉(zhuǎn)化,為全方位釋放語言文字在經(jīng)濟(jì)社會(huì)發(fā)展中的數(shù)據(jù)要素價(jià)值奠定更加寬厚基礎(chǔ)。

  近期,教育部、國家語委、中央網(wǎng)信辦印發(fā)《關(guān)于加強(qiáng)數(shù)字中文建設(shè) 推進(jìn)語言文字信息化發(fā)展的意見》(以下簡(jiǎn)稱《意見》)。其中提到,到2027年,國家數(shù)字中文建設(shè)行動(dòng)取得重要成效,語言文字?jǐn)?shù)據(jù)要素價(jià)值有效釋放。基本形成“政府主導(dǎo)、部門協(xié)同、社會(huì)參與、共建共享”的語言文字信息化工作機(jī)制;基本建成國家語言文字大數(shù)據(jù)中心,初步建成國家關(guān)鍵語料庫和國家戰(zhàn)略語言資源信息庫;語言文字信息化標(biāo)準(zhǔn)、前沿語言技術(shù)、優(yōu)質(zhì)語言資源、新型語言服務(wù)等基礎(chǔ)支撐能力顯著增強(qiáng)。

  “國家關(guān)鍵語料庫”是什么

  《意見》提出,推動(dòng)基礎(chǔ)性語言資源建設(shè),實(shí)施國家關(guān)鍵語料庫共建共享計(jì)劃,重點(diǎn)支持建設(shè)大規(guī)模中文語料庫及高質(zhì)量民族語言文字語料庫、手語盲文語料庫、行業(yè)領(lǐng)域語料庫、語言監(jiān)測(cè)動(dòng)態(tài)語料庫等。

  教育部語言文字信息管理司相關(guān)負(fù)責(zé)人在接受中青報(bào)·中青網(wǎng)記者專訪時(shí)提到,語料庫是自然語言處理、大語言模型、人工智能技術(shù)創(chuàng)新應(yīng)用的重要支撐,是經(jīng)濟(jì)社會(huì)信息化建設(shè)、數(shù)字化賦能和智能化發(fā)展的基礎(chǔ)要素,促進(jìn)語言數(shù)據(jù)賦能信息技術(shù)創(chuàng)新與信息技術(shù)賦能語言文字資源使用的雙向賦能。

  以文化傳承領(lǐng)域?yàn)槔?,目前已?jīng)建設(shè)了中華思想文化術(shù)語庫、中華精品字庫、甲骨文數(shù)據(jù)庫、中國語言資源保護(hù)數(shù)據(jù)庫等。

  其中,中華思想文化術(shù)語庫包括了中華民族所創(chuàng)造或構(gòu)建,凝聚、濃縮了中華哲學(xué)思想、人文精神、思維方式、價(jià)值觀念,以詞或短語形式固化的概念和核心詞。該語料庫中包括1200余條思想文化術(shù)語、中醫(yī)文化關(guān)鍵詞、典籍譯本、典籍譯名、博雅雙語詞等。

  教育部語言文字信息管理司相關(guān)負(fù)責(zé)人提到,2024年,智能化學(xué)習(xí)工具“AI小語”正式上線。“AI小語”是以中華思想文化術(shù)語庫為基礎(chǔ)訓(xùn)練語料、以大語言模型技術(shù)為核心技術(shù)的高交互感智能平臺(tái),對(duì)賦能中華優(yōu)秀傳統(tǒng)文化對(duì)內(nèi)傳承和對(duì)外傳播具有重要意義。

  截至目前,教育部、國家語委通過組織開發(fā)、集成匯聚、動(dòng)態(tài)更新等方式,組織高校、企業(yè)、科研院所等,建設(shè)大規(guī)模高質(zhì)量語料庫30余項(xiàng),相關(guān)語料庫已廣泛應(yīng)用于經(jīng)濟(jì)社會(huì)發(fā)展的關(guān)鍵領(lǐng)域。

  “國家關(guān)鍵語料庫”怎么建

  “信息技術(shù)深刻融入經(jīng)濟(jì)社會(huì)發(fā)展各領(lǐng)域,需要推動(dòng)語言文字與信息技術(shù)的深度融合,找準(zhǔn)兩者的結(jié)合點(diǎn)、融合點(diǎn)、發(fā)力點(diǎn)?!苯逃空Z言文字信息管理司相關(guān)負(fù)責(zé)人說。

  長期以來,國家語委會(huì)同有關(guān)部門研制并發(fā)布了《信息技術(shù)中文編碼字符集》等國家通用語言文字和民族語言文字信息化規(guī)范標(biāo)準(zhǔn)100多項(xiàng),為自然語言處理技術(shù)在人工智能、數(shù)字產(chǎn)品和信息產(chǎn)業(yè)領(lǐng)域的應(yīng)用創(chuàng)新奠定規(guī)范基礎(chǔ)。

  面向人工智能時(shí)代,該負(fù)責(zé)人介紹,要開展語言資源建設(shè)、管理、應(yīng)用、共享標(biāo)準(zhǔn)研究,重點(diǎn)推進(jìn)語料庫、數(shù)據(jù)標(biāo)注、數(shù)據(jù)評(píng)價(jià)等規(guī)范標(biāo)準(zhǔn)的制訂;服務(wù)教育教學(xué),研制大語言模型能力素養(yǎng)(師生版),引導(dǎo)師生有效、安全使用大語言模型等人工智能技術(shù);助力文化傳承,研制甲骨文數(shù)字化共享技術(shù)標(biāo)準(zhǔn)。

  此外,既要支持語言文字信息處理基礎(chǔ)標(biāo)準(zhǔn)研究,也要鼓勵(lì)高校、企業(yè)開展行業(yè)標(biāo)準(zhǔn)、企業(yè)標(biāo)準(zhǔn)研制。加強(qiáng)與工信部、國家民委、國家標(biāo)準(zhǔn)委等部門單位合作。推動(dòng)已有語言文字信息化相關(guān)規(guī)范標(biāo)準(zhǔn)的修訂工作,加強(qiáng)已有規(guī)范標(biāo)準(zhǔn)的宣傳推廣等。

  在專業(yè)化人才隊(duì)伍培養(yǎng)上,教育部語言文字信息管理司相關(guān)負(fù)責(zé)人提到,推動(dòng)高校增設(shè)語言智能、計(jì)算語言學(xué)等交叉學(xué)科方向,增設(shè)“語言文字+人工智能”核心課程。此外,鼓勵(lì)企業(yè)建設(shè)產(chǎn)教融合實(shí)訓(xùn)基地,開展中文信息處理、多語種機(jī)器翻譯、語料加工處理、數(shù)據(jù)標(biāo)注等技能培訓(xùn),提升中文專業(yè)以及相關(guān)專業(yè)學(xué)生的職業(yè)技能,擴(kuò)大就業(yè)范圍和就業(yè)渠道。

  “今年是落實(shí)《教育強(qiáng)國建設(shè)規(guī)劃綱要(2024-2035年)》的關(guān)鍵之年,語言文字信息化發(fā)展將展望十年、謀劃五年、立足三年,把握賦能全局高度,加快試點(diǎn)先行進(jìn)度,激發(fā)協(xié)同創(chuàng)新力度,在落實(shí)重點(diǎn)任務(wù)上下功夫、見實(shí)效?!痹谇安痪门e行的教育部新聞發(fā)布會(huì)上,教育部語言文字信息管理司司長劉培俊說。

  中青報(bào)·中青網(wǎng)記者 楊潔

【編輯:付子豪】
發(fā)表評(píng)論 文明上網(wǎng)理性發(fā)言,請(qǐng)遵守新聞評(píng)論服務(wù)協(xié)議
收藏文章
表情删除后不可恢复,是否删除
取消
确定
图片正在上传,请稍后...
评论内容为空!
还没有评论,快来抢沙发吧!
本網(wǎng)站所刊載信息,不代表中新社和中新網(wǎng)觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
Copyright ©1999-2025 chinanews.com. All Rights Reserved

評(píng)論

頂部

沛县| 长岛县| 新泰市| 禹城市| 阳城县| 辽中县| 绩溪县| 平武县| 长汀县| 六安市| 陕西省| 承德县| 新平| 中山市| 图片| 张家口市| 潮安县| 弥勒县| 霍州市| 上犹县| 寿阳县| 安义县| 镇平县| 兴业县| 聂荣县| 突泉县| 保定市| 教育| 玛曲县| 甘孜| 晋宁县| 尉犁县| 建水县| 易门县| 铁力市| 房山区| 凤庆县| 新建县| 云霄县| 阿瓦提县| 阿荣旗|