3.《通用規范漢字表》的性質
漢字規范一直是我國新文化建設中一項重要的基礎工作。《通用規范漢字表》是《國家通用語言文字法》的配套規范,是體現國家文字政策的重大規范,將經國務院批準、由教育部和國家語言文字工作委員會發布。
《通用規范漢字表》說明第二條指出:“《通用規范漢字表》是現代記錄漢語的通用規范字集,體現現代通用漢字的字量、字級和宋體字形的規范。”這個定義式的說明可以從以下三個方面來理解:
規范性是字表的首要特點,也是字表的本質屬性。字表給出了確定的字量、字級,實現了字形與用字的標準化。表中規定了三個等級的字集,各級字集所收的字,字頭都經過嚴格選取,并根據規則進行了字形整理,完全可以成為我國社會通用領域漢字的正字,在字形上具有唯一標準的作用。
現代性是字表的第二個特點。字表的分級、收字都是從現代應用出發的,充分考慮到現代語言文字生活的需要,所收的字也主要從現代漢語語料庫中選出。現代文本中的文言文引文和中小學語文教材中的文言文,是當今文化傳承和文化學習所必需的,而且需要用簡化字印刷,其用字屬于現代用字的范疇,這些字也已納入了字表。
通用性是字表的第三個特點。在現代一般社會用字領域,沒有必要對一些罕用字或生僻字進行標準化處理,經過規范整理的8300字,都是現代社會需要的通用字。字表按通用程度分級:一級字表的通用性最高,二級次之,三級字表雖然取自專業領域,但這些字都與國計民生的信息傳播息息相關,在計算機存儲和閱讀上也有通用性。
4.《通用規范漢字表》發布后在有關領域如何實施
《通用規范漢字表》的制定,是為了方便群眾和各界更好地使用漢字。各領域在使用時,可根據其用字特點和實際需求,采取既遵循規范、又有一定寬松度的實施辦法:
(1)專業性的古籍印刷,書法和牌匾等手寫字,可以用繁體字與傳承字。為了社會釋讀的方便,也為了印刷編輯部門有據可依,古籍印刷使用的繁體字也要適時進行整理。在沒有制定相關標準之前,建議采用歷史上曾經通行的漢字,即:字形要有歷史上使用過的依據;有多個字形可以采用時,要盡量選取通行度高、易于識別的;不要生造新字或亂改字形。
(2)基礎教育語文新課標規定,小學階段識讀漢字的數量為3500個。這3500字應采用《通用規范漢字表》的一級字表。但根據教學需要,尚需在3500常用字范圍內再劃分應用子集時,比如第一、二、三學段分別應該學其中的多少字、學哪些字,教育管理部門可按照兒童不同年齡段的認知特點,以漢字必要的屬性做參數,經過科學研究,生成適用的應用字表。需要強調的是:《通用規范漢字表》給出的僅僅是宋體字的規范字形,而我國小學語文課本1-3年級的課文和各年級的生字都是以楷體字印刷的,兩種字體在筆形上略有差異,在楷體字字形沒有新的規范之前,仍沿用原有楷體字形。
(3)根據需要可以使用表外字。所使用的表外字如果有繁體部件,根據規定,不得類推簡化。若為了保持系統的一致性而確需類推簡化,例如新化學元素用字等,可報國家語言文字工作主管部門審批。
(4)字表發布后,如有當用的姓氏用字尚未收入,可報國家語言文字工作主管部門,經專家審定和相關部門確認后,適時補充進字表。
(5)使用漢字的工業產品,特別是信息產品,要遵守漢字規范的原則,不應違背字表。由于產品更新需要一定的周期,字表公布后,與字表規定不一致的產品用字的更改,可以有個過渡期,在此期限內應積極采取措施,以盡快與國家規范切合。
5.《通用規范漢字表》表內字分級的理據及一、二級字表的字量與收字
作為國家規范,字表將要面對的是全體使用者,全體使用者的文化水平不同,交際范圍不同,行業需求不同,對漢字的使用要求也必然會有差異。而且,漢字本身的使用頻率存在著很大的差別,通用的程度是不一樣的。因此,字表只有對所收字進行合理的分級,才能反映漢字的實際使用狀況,照顧不同人群的需求差異,從而提高字表的實用性。
字表收字8300個,根據它們的通用程度,劃分為三級,各級字表的收字數量、每個字的標準字形以及某些字的使用范圍,都有明確規定。一級字表共收3500字,是一般社會領域使用頻度最高的常用字集,主要滿足基礎教育和文化普及層面的用字需要。二級字表共收3000字,一般社會領域也會經常使用,但其使用頻度明顯低于一級字;一、二級字表一共6500字,主要滿足現代漢語文本印刷出版用字的需要。三級字表共收1800字,是姓氏人名、地名、科技術語和中小學語文教材文言文用字中未進入一、二級字表的較通用的字,主要滿足與大眾生活密切相關的專門領域用字的需要。
常用字是使用頻率最高的字,這批字覆蓋了絕大部分通用的語料,人們閱讀和書寫時常常使用它。常用字必須夠用,但也不是越多越好,準確確定常用字的數量,并把應當收入的常用字收入,對漢字信息的傳遞,以及識字教學、字書編纂等應用,都具有重要意義。制定《通用規范漢字表》,在理論上根據的是“漢字效用遞減率”這一重要的原理。頻率反映的是漢字的具體使用情況,個體字符的使用頻率不是平均分布的,隨著字頻的下降,漢字使用的覆蓋率呈遞減趨勢。當字頻降到一定程度,覆蓋率基本不再上升。因此,掌握以下數據,就可以大致統計出常用漢字的數量:(1)從一定通用語料中測查出的漢字使用頻率的降次排列表;(2)每個頻次段落語料中所含的不重復的漢字數的遞增量;(3)每個頻次段落中覆蓋率的增長數。
要想得到這些數據,選取什么樣的語言材料和多少字數的語言材料進行統計,直接影響統計結果的代表性、客觀性和準確性。制定《通用規范漢字表》,選定國家語委的“現代漢語平衡語料庫”為基礎語料庫。該語料庫按照時代與領域平衡的原則,收錄1919年至2002年的語料9100萬漢字,不重復漢字8181個。同時,采用北京語言大學“現代新聞媒體動態流通語料庫”(收集2001-2002年15種報刊語料共3.5億漢字)和《通用規范漢字表》課題組建立的“教育科普綜合語料庫”(收集1951-2003年的中小學通用教材及科普讀物語料404萬漢字),作為核查、驗證的輔助語料。同時還參考了國家語言資源監測與研究中心2005-2008年建立的平面媒體、網絡媒體、有聲媒體、教育教材等海量語料庫及海內外幾十個其他語料庫。利用這些語料庫進行統計與分析,得到了《通用規范漢字表》一、二級字表的分級、字量和收字的基本結果。
在確定一、二級的字量與收字時,始終以客觀的統計數據作為主要判斷依據。但由于漢字自身和漢字使用都具有很強的人文性,漢字字集的界限并不是截然分明的,而是存在一定數量的“臨界字”,對于這些“臨界字”,只有進行人工的調整,才能更加科學地反映漢字使用的實際狀況。在確定一級字表時,作了如下人工干預:(1)補全了10個大寫數目字、22個干支字、31個省(直轄市)簡稱用字和一部分常用聯綿詞的缺字;(2)增加“兒童文學語料庫”(收1949年后出版的適合基礎教育閱讀的各種體裁兒童文學語料570萬漢字)的口語高頻字;(3)提出頻次位于3201至3500的300字,向中小學教師進行問卷調查,將其中通用度相對小的字與所增加的字置換,并將被置換的字降到二級字表。經人工干預調整的字量約占3%。在確定二級字表時,主要是對備選字表的字逐一進行核查、甄別,排除備選字表中意義離現代較遠、形體上與其他字有糾葛的字,用三級字表中頻度相對較高的字補足。
此次確定的一級字表的3500字與原《現代漢語常用字表》的3500字比較,有103字的出入,但在不同語料庫中的覆蓋率比原來的常用字高出0.09%~0.22%。一、二級字表的6500字,與原《現代漢語通用字表》的7000字比較,減少了500字,但在不同語料庫中的覆蓋率基本不變。字數減少而覆蓋率保持不變的原因,首先是我國幾十年來漢字規范工作取得了成效,適用性較差的字被自然淘汰,社會用字相對集中。同時也可看出,《通用規范漢字表》選字和定量的資料是優化的,方法是科學的,程序是合理的。
|