- 政策解讀
- 經濟發展
- 社會發展
- 減貧救災
- 法治中國
- 天下人物
- 發展報告
- 項目中心
視頻播放位置
下載安裝Flash播放器
二是語言文字信息管理工作也在深入推進。2009年發布了4項國家語委規范,有《漢字部首表》、《現代常用字部件及部件名稱規范》、《現代常用獨體字規范》,并且還用綠皮書的方式發布了6項規范草案,主要是兩類,包括《日本漢字漢語讀音規范》,還有跟語言信息處理相關的規范,比如說語料庫一些原數據的規范等等。
2010-11-25 10:41:34
三是國家語委中國語言資源有聲數據庫建設,在江蘇省進行試點,首批試點通過驗收,第二批試點工作啟動,其中少數民族有聲數據庫建設的試點工作在云南啟動。為了保證這項工作有序進行,發布了中國語言資源有聲數據庫建設的各項技術規范與工作規范,印制出版了《中國語言資源有聲數據庫調查手冊》。同時,中國語言資源監測與研究中心與相關單位每年都要發布主流媒體的十大流行語。在民族語言工作方面也有很大的進展,最重要的就是2009年7月份,國務院發表了一個重要文件,《國務院關于進一步繁榮發展少數民族文化事業的若干意見》,其中有4條都談到少數民族語言文字工作。成立了全國彝語的術語標準化工作委員會,并且成立2個國家語言資源監測與研究中心下面少數民族語言研究基地,一個是維吾爾語文研究基地,一個是藏語文研究基地。同時,少數民族研究的一些重要項目完成研制工作。文化部全國文化信息資源建設管理中心還啟動了康巴藏語節目的譯制工作。
2010-11-25 10:42:43
四是新聞出版方面,2009年主要進行了全國教育教學輔助類報紙編校質量檢查,發現教育類、輔助類報紙、全國行業類報紙的編校質量不斷上升。廣電總局出臺了《關于嚴格控制電視劇使用方言的通知》,這是針對目前的語言生活的一些重要的情況。
2010-11-25 10:46:06
漢語國際傳播規模穩步擴大。像孔子學院的建設,志愿者的派遣等等,這些工作有很大的影響。不僅國家語委和國家相關部門做了大量的工作,而且地方語委也做了大量的工作。比如上海、江蘇、浙江等地,為了世博會的順利召開,編制發布了公共場所的英文譯寫規范。天津市語言文字培訓測試中心受國家語委委托,在馬來西亞成功舉行了兩場普通話水平測試,引起了強烈的反響。朗誦水平等級考試也在上海開展。所以地方語委語言文字工作也是亮點不斷。
2010-11-25 10:46:10
第三,2009年三類媒體語言文字使用的一些情況。這三類媒體是平面媒體、有聲媒體、網絡媒體。網絡媒體主要是新聞。我們總共統計了120多萬個文本文件,10億多字次。
一是漢字使用情況。高頻字使用非常穩定,字種的數量有所增加。
二是詞語使用非常有意思,不同的媒體年度使用的詞語相似度很小,報紙的用詞、廣播電視的用詞和網絡的用詞,這三類媒體的用詞差別很大。這反映了這三類媒體在語言使用上和對事件的關注點上已經各自逐漸形成自己的特點。很多高頻詞語的變化,體現了年度的特色,比如當年出現的一些新的事件,這說明語言對社會生活的反應非常敏感。通過語言的分析,可以如實地看到2009年我們的社會生活。
2010-11-25 10:46:18
新詞語是語言生活蓬勃發展的體現,是社會發展的一種語言智慧。2009年,我們在語料中提出新詞語396條,對這396條詞語進行分析,發現三音節詞占多數,過去我們都說漢語雙音節是主要構詞形式,現在看起來漢語新詞的產生主要是三音節。從構成的材料來看,主要還是用漢字構成的,占主流,98%都是漢字構成的詞,說明新詞語還遵循了漢語構詞的習慣。
2010-11-25 10:50:25
結構方式有兩點值得注意,一個是偏正式構詞能產性最高,這些年來經常用像后綴的構詞法,比如什么門,什么族,什么客,構詞仍然非常方便,而且疊加方式構詞明顯多。但是從使用頻率來看,新詞語進入高頻詞的不多,個別進入高頻字,說明我們語言生活一些新詞語還是在一般層面一些特殊人群在使用。
第四,語言生活狀況報告的新聞發布已經五年了,我們對五年來的情況也做了一些比較。
首先,我們發現這五年來,高頻字使用非常穩定。我們看看05年到09年使用的情況,高頻字覆蓋整個語料80%、90%、99%,用字數量基本上差不多。而且在最常用的3500字里面,這五年來有3358個字是相同的,說明語言生活目前用字比較穩定。
二是每年的語言生活出現一些有特色的用字。這些有特色的用字,都反映了當年的重要事件。
2010-11-25 10:53:12
三是年度用字總表與現行規范字表之間的差異。比如最常用的是《現代漢語通用字表》,這是上個世紀制定的7000通用字。但是現在媒體里面,語料來看,有661個字沒有在這個字表里面出現。這種情況也說明了語言文字的規范應該根據時代的發展不斷調整。同時,也說明了現在用大規模的語料統計方法看語言使用情況,提供很大的支撐。從詞語來看,總體上高頻字穩定使用,但是每一年高頻詞都有一些變化,這些變化都會體現當年的語言生活的變化的情況。
2010-11-25 10:58:34
第五,今年我們對8套小學語文教材的用字情況進行了比較分析,大陸6套、中國臺灣1套、中國香港1套。這8套小學語文教材用字總共出現的字是3855個,其中生字出現最多的是人教社的新課標版,出現生字2997個,出現生字最少的是臺灣的康軒版,2238個。這8套教材當中,在生字表里面都有的字是1397個,占總生字數的36.24%;有很多字是在其中一套教材里面出現,大概有505個,占13%。這個情況說明我們教材里面用字雖然差別不大,但是哪個教材用哪些字,差別很大。要知道這是小學教育,小學教育在我們的印象里面,使哪些字大致差不多,但是通過統計,我們發現情況很不一樣,每一套教材里面用哪些字差別比較大。
2010-11-25 10:58:45
漢字首次出現生字教學用字中的情況。我們發現小學第二個學期、第三個學期、第四個學期是用字的高峰,也就是一年級下學期和二年級,是識字的高峰。由于各種教學方法的不同,人教社新課標版生字起伏比較大,臺灣康軒版生字出現比較平穩,一個學期學多少,比較有節制。這可能是教學方法不一樣產生的。
今年對2009年少數民族語言情況進行了分析,主要是藏語和維吾爾語。藏語,主要是對小學藏文語文新課標教材用詞情況進行統計,這是我國首次就少數民族語言文字教育教材使用狀況進行調查,為教材的客觀評價提供了一些定量的參考,也為藏文的量化、字詞教學來提供一些根據,為今后更好地提高藏語文教材的編寫質量奠定基礎,從而更好地為藏語的雙語教學服務。我們調查藏語教材用的是青海民族出版社2009年5月出版的五省區語文實驗教材的教科書。
2010-11-25 11:00:08
藏語文教材每一冊的生詞是雙音節詞最多,詞長比例呈現不等式,雙音節詞、單音節詞、三音節詞、四音節詞。
從課文用詞來看,我們調查12冊教材里面共出現藏語詞種9000多條,詞種總數97萬左右。所以,課文用詞的總數大大高于課文的生詞總數,而且隨著年級的增高,學習詞種的數量不斷增加,說明我們藏文小學課文的編寫還是比較重視詞語使用的科學性。我們還調查了高頻詞使用情況,特別500高頻詞的情況。我們還進行了其他的調查項目。
2010-11-25 11:08:21
另外,我們還調查了維吾爾文的情況,使用的主要是9大網站的語料,有新疆政府網、昆侖網、天山網、教師網、醫學網等9大網站。采集語料的時間跨度是從2006年到2009年。語料的內容涉及方方面面,有政治、經濟、科學研究、教育、健康等多個方面,總共的語料數量不是很多,詞符種數20萬條,詞符頻次547萬次、文本數15878個。調查了符號使用情況,總共使用了38種符號。維吾爾構詞非常有意思,有詞干和詞尾,我們對詞尾的情況作了一些調查,有一個詞表,很多專家覺得通過這樣的調查加強對維吾爾文使用情況的了解是非常重要的。維吾爾文用詞呈現出低頻詞種數龐大,說明維吾爾語還是充滿活力的,詞的數量很多。但是,使用起來還是相對集中,高頻詞使用集中,這些情況跟漢語的情況基本差不多。
2010-11-25 11:08:39
維吾爾文字母長度很長,1-4個字母的詞比較少,使用4個字母以上的詞為主。少數民族語言用詞調查工作還面臨著兩大困難。一是資料收集困難,電子文本沒有漢語電子文本多。二是少數民族語言文字信息處理技術的平臺問題,在怎么分詞、怎么用計算機統計方面,還需要進一步加強。但是,調查的意義重大,調查得到的語言數據都是實態的,及時地發布數據可以為少數民族語言文字的規范化、標準化和信息化提供科學的支撐,也可以為科學研究和相關單位的決策提供參考。國家語言資源監測研究中心高度重視民族語言文字的監測與研究工作,今后這項工作還要繼續進行。對今年的年度生活狀況報告已經開始著手分析了,到明年我們再發布今年的語言生活狀況報告的情況。謝謝各位。
2010-11-25 11:08:53
謝謝李司長。國家語委對我們今天的發布會非常重視,我們語用司的張世平副司長、語信司的王鐵琨副司長、相關處室的負責同志都在座,也非常的歡迎和感謝他們。下面的時間留給各位記者朋友,歡迎大家提問。
2010-11-25 11:09:11