中國網首頁

      首頁  >   向young云  >

      專家:加強數字中文建設需從三個維度重塑發展格局

      2025-04-01 09:07

      來源:中國網

      分享到:
      鏈接已復制
      字體:

      中國網4月1日訊(記者 劉佳)20世紀中文信息處理技術解決了漢字進電腦、上網絡的歷史性問題,迎來從“鉛與火”到“光與電”的革命。時至今日,人工智能技術快速發展,中國如何加強數字中文建設,從而推動中文信息處理技術創新發展?

      在教育部3月31日舉行的新聞發布會上,中國網記者就此提問北京大學王選計算機研究所所長湯幟。他認為,要聚焦關鍵垂直領域建設語料基礎設施,構建支持大模型訓練的高質量中文數據集,同時形成“技術突破—場景落地—生態繁榮”的良性循環。

      中國網記者現場提問。中國教育報記者 張勁松/攝

      20世紀80年代,王選院士的團隊發明激光照排技術,并結合漢字的編碼標準,突破了中文數字化的空間限制,讓承載中華文化的中文在全球互聯網空間獲得新生。當前,大語言模型技術對大規模高質量語料提出前所未有的需求,賦予了數據中文化新的歷史內涵和使命任務。中文信息處理技術的發展從以往解決漢字輸入輸出的基礎性問題,進階到當先釋放語言文字數據要素價值的全方位突破。

      湯幟認為,加強數字中文建設需從三個維度重塑發展格局,推動中文信息處理技術發展進入新階段:即從重要資源轉化到數據要素價值;從廣泛存在聚焦到關鍵領域應用;從基礎支撐提高到賦能全局發展。

      湯幟表示,新形勢下,語言文字將實現從“靜態符號”向“動態數字資產”,從“信息載體”向“生產要素”的轉型,要重點推動語料庫、數據標注與評價等標準的研制,支持文本生成與理解、語言翻譯、情感分析等各種任務。

      語言文字“日學而不察、日用而不覺”,廣泛存在于社會生產各個方面。新形勢下,語言文字將實現從符號存儲到智能建模的質變,要聚焦關鍵垂直領域建設語料基礎設施,構建支持大模型訓練的高質量中文數據集。

      當前,人工智能技術發展迅速,語言文字信息處理技術創新應用正經歷從“GB2312字符集”到“萬億參數大語言模型”的范式變革。湯幟強調,新形勢下,語言文字將實現與信息技術的深度融合,要形成“技術突破—場景落地—生態繁榮”的良性循環,打造數字化引領品牌,有力服務教育發展、助力科技創新、賦能文化傳承、推動產業升級、促進社會進步。

      編審:張艷玲 王月博

      主站蜘蛛池模板: china同性基友gay勾外卖| 亚洲国产欧美日韩精品一区二区三区| aa视频免费看| 日本www视频| 亚洲国产欧洲综合997久久| 精品日韩欧美一区二区三区| 国产真实乱子伦视频播放| gogogo高清在线播放| 日本三区精品三级在线电影| 亚洲成a人一区二区三区| 精品人妻无码专区在中文字幕| 国产精品一区二区无线| 丁香婷婷激情综合俺也去| 最近免费中文字幕视频高清在线看 | 欧美国产激情18| 午夜香港三级在线观看网| 黑白配hd视频| 欧美日韩国产专区| 国产91在线|日韩| heisiav1| 日日噜噜夜夜爽爽| 亚洲人成人77777网站| 狠狠色综合网久久久久久| 国产一区二区三区影院 | 男男gay做爽爽的视频免费| 国产乱码一区二区三区爽爽爽 | 日本边添边摸边做边爱的视频| 亚洲欧美日韩网站| 精品久久久久久无码中文字幕| 国产又色又爽又刺激在线播放 | 亚洲第一永久色| 精品人妻少妇一区二区三区在线| 国产在亚洲线视频观看| 男女一进一出无遮挡黄| 在线观看精品视频看看播放| 一本久久综合亚洲鲁鲁五月天| 日韩人妻无码中文字幕视频| 亚洲人成网站免费播放| 毛片a级毛片免费观看品善网| 华人生活自拍区杏吧有你| 蜜桃视频在线观看免费网址入口|