前幾天,《京華時報》上連續(xù)刊載了三個字典上沒有的怪“字”。
它們是什么意思呢?想要搞清楚,先一起來看看有關(guān)漢字的小秘密
漢字不等同于象形文字
常有人說漢字是一種“象形文字”。其實,這種說法是錯的,漢字是一種“語素——音節(jié)文字”。象形只是漢字眾多造字方法中的一種。
李大遂在統(tǒng)計了《漢字等級大綱》中列舉2906個現(xiàn)代常用漢字后,指出其中的象形字只有不到7%。在非常用漢字中,象形字所占比例更遠(yuǎn)遠(yuǎn)小于這個數(shù)值。即使上推到最古老的甲骨文里面中,象形字所占比例也連一半到不了。
經(jīng)李大遂統(tǒng)計,HSK(中國漢語等級考試)《漢字等級大綱》所收常用漢字中,象形字占比不足7%。圖片來自李大遂《簡明實用漢字學(xué)(第3版)》
經(jīng)劉志基統(tǒng)計,甲骨文中象形字所占比例約為43.53%,到了西周金文里,這個比例更是迅速下降到了不到10%,而形聲字則迅速成為了漢字的主流。
漢字一共有多少個?
收字最多的辭書里是85568個
漢字的數(shù)量是隨著歷史發(fā)展而增加的。
早稻田大學(xué)圖書館藏?fù)P州使院刻本《集韻》書影。你在上面找到了多少不認(rèn)識的字?
從歷代辭書中,我們可以大致看出漢字?jǐn)?shù)量逐漸增長的趨勢。李宗焜所編《甲骨文字編》中收錄的已發(fā)現(xiàn)的甲骨文單字字頭共有4378個。到了東漢,許慎所編《說文解字》的自敘稱該書收了9353個不同的字。再到北宋的《廣韻》,收字的數(shù)量已經(jīng)爆炸到了26194個。而清人編著的《康熙字典》,收字量更是達(dá)到了47035個。目前收字最多的辭書是現(xiàn)代學(xué)者編寫的《中華字海》,其中收錄的漢字字頭數(shù)(包括日韓漢字)是85568個。這應(yīng)當(dāng)已經(jīng)接近甚至超越了歷史中存在過的漢字?jǐn)?shù)量的上限。
所有的漢字電腦都認(rèn)識?
并不是這么多漢字,并非每一個都可以在你的電腦上顯示出來。比如一般中文字體使用的GB2312標(biāo)準(zhǔn)簡體中文字符集就只包括6763個字。這相對漢字的實際數(shù)量而言太少了,于是后來又出臺了許多擴(kuò)展包。目前國際通用的“中日韓越統(tǒng)一表意文字編碼系統(tǒng)”,共收錄漢字、日韓越漢字、民族文字共計80388個。當(dāng)前大部分的電腦、網(wǎng)頁都能兼容這些文字。雖然從方便學(xué)術(shù)研究的角度看,這個字庫還有著進(jìn)一步完善的空間,但是對一般人來說,這個庫已經(jīng)大得驚人了。
中日韓統(tǒng)一表意文字字庫的一部分
雖然漢字一共有八萬多個,但是大部分都是沒什么人用的死字。裘錫圭認(rèn)為,每個時期常用的漢字雖然不盡相同,但是總數(shù)都是四五千個。經(jīng)陳明遠(yuǎn)統(tǒng)計,現(xiàn)代最常見的5200個漢字可以涵蓋一般書刊內(nèi)容的99.99%。別忙著高興,即使把范圍縮小到5200個字,也已經(jīng)超過中國人的平均識字量了。
5誰是最愛造字的皇帝?大名鼎鼎武媚娘漢字變得越來越多,那一定是因為有人造字?;实劬褪且活愄貏e愛好造字的人?;实蹛墼熳?,最常見的一個理由是方便避諱。比如三國時期東吳的第三個皇帝孫休就曾經(jīng)為他的四個兒子造了八個他自以為前無古人,所以不會讓民間覺得避諱麻煩的字。
《三國志》上記載孫休造字部分的書影。明汲古閣《十七史》本
孫休所造的八個字。圖片截取自鄭張尚芳《有歷史記錄的造字者的身份和動機(jī)》一文
其實,最會造字的皇帝是的大名鼎鼎的武媚娘。她執(zhí)政時不僅為9個常見字制造了全新的字形,還強(qiáng)制要求推廣另外的8個常用字的罕見的古老異體。經(jīng)她這么一折騰“天”、“地”、“日”、“月”、“星”等一些常見字都變得面目全非了。
媚娘造的字:
使用武則天新字書寫的武則天《升仙太子碑》拓片。本段碑文內(nèi)容為:“大周天冊金輪圣神皇帝御制御書:朕聞天地權(quán)輿,混元黃于元?dú)猓魂庩柌荨逼渲小疤臁?、“圣”、“地”等字和通行字體差別很大,比如“地”就寫作“埊”形
一個漢字有時會有不同寫法,其中一種規(guī)范寫法叫“規(guī)范漢字”,多出來的寫法都叫錯別字異體字。漢字系統(tǒng)中異體字的數(shù)量相當(dāng)龐大。*省“教育部”所編《異體字字典》收錄了正字29892個,收錄的異體字卻達(dá)76338個,平均其中的每一個漢字都有大約2.6個異體字,還總有學(xué)者批評它不全。越是常用字,人們腦洞開得越大,異體字也就越多。“回”這樣常用的字,實際存在的異體寫法超過三十種,孔乙己是說少了。
“回”字的部分異體寫法。圖片截自*《異體字字典》查詢系統(tǒng)(dict2.variants.moe.edu.tw )。
讓我們回憶一下化學(xué)課的知識,回想一下化學(xué)專有名詞有什么特點(diǎn)。氫、氦、鋰、鈹、硼;炔、烯、烷、醇、醛……發(fā)現(xiàn)了嗎,它們幾乎全是形聲字。但是,標(biāo)準(zhǔn)化學(xué)用字中卻有一個象形字:甾。
元素周期表上全都是形聲字
這個字讀[z i],在古代常作“災(zāi)”的異體字,現(xiàn)代化學(xué)借它表示包括了類固醇類有機(jī)物。這個字象類固醇分子式之形,其中“田”代表了甾環(huán)的四個環(huán),上面的三折則指代了甾環(huán)外的側(cè)鏈。許多常見激素都屬于甾體類物質(zhì)。
下一次青春的荷爾蒙讓你躁動不安時,請一定要回憶一下今天看到的這個字。
地塞米松的分子式。與許多常見的性激素和膽固醇一樣,地塞米松也是一種甾體類有機(jī)物
每年過年的時候,你或許會看到有人張貼類似于這樣的“招財進(jìn)寶”、“黃金萬兩”。
這些把很多個漢字中存在的構(gòu)件強(qiáng)行拼合在一起,組成一個類似于方塊字的集合的玩法,在文字學(xué)上叫作“合文”,也叫“合書”或“重構(gòu)字”。我們說過,漢字是語素音節(jié)文字。這種合文不指向單一語素,讀出來包括一排音節(jié),所以它們不是一般意義上的漢字,而是以漢字字形為基礎(chǔ)進(jìn)行的一種文字游戲。
用合文寫的對聯(lián),你能認(rèn)的出多少?圖片來自《中國楹聯(lián)報》2015年3月15日第三版
也不是沒有人想過要把它變成漢字。在敦煌俗文字里面,就經(jīng)常有(懶)人從組成一個詞的幾個字中分別拿出一部分拼出一個新字,借此代表整個詞。十九世紀(jì)以后,曾有人制造了類似于“瓩”、“兛”、“粴”一類的表示千瓦、千克、千米等常用單位的計量用漢字,并將其像正常漢字一樣使用。民國時,北平研究所的字體研究會甚至想把“石油”、“方案”等詞全部做成合文,把漢字從語素音節(jié)文字變成詞文字。然而這些嘗試缺乏社會基礎(chǔ),均已遭到淘汰。
雖然合文加入漢字大家庭的努力失敗了,但是這并不妨礙它在漢字體系之外作為一種民俗娛樂形式的存在。由于沒有條條框框的規(guī)范限制,創(chuàng)造合文的游戲玩法多樣,老少咸宜。誰都可以給自己身邊熟悉的事物制造合文。



