我们聊了不少生僻字了,有些是特别字,有些是某一个汉字的特别写法。固然我们常说常用汉字不外3000,但有些汉字大概有许多种写法。
云云下来汉字本相一共有几多个呢?今日我们来商议一下这个题目。
1
自古以来的汉字数目
中华上下五千年,汉字的汗青可太长了,以是汉字一共有几多个是个很难说清晰的题目。
据学者考据,甲骨文和金文共有汉字约5000个,我们已知其寄义的约有3000个。
我国最早的字典《说文解字》,收录汉字9353个。
北宋《类编》收录汉字高达33190个,而清朝《康熙字典》收字46933个,是古代收录汉字数目最多的字典。
《汉语大字典》收录单字56000多个,20年公布的最新版《新华字典》收录单字13000多个。
家人们不消惊奇于数目,《当代汉语常用字表》只有3500个汉字,而依据中国说话生存状态陈诉,2394个常用汉字就据有了99%的说话篇幅。
所谓常用汉字,以庞中华硬笔书法为例,小时间我家里有这本书,妈妈逼着我练,我以为好不甘心。这个字帖是2500字。
2
差别编码尺度带来的题目
在电脑遍及、数字化期间到来之前,我们也只能以字典为尺度,统计汉字的数目。
然而数字化期间到来之后,除了字典,我国当局开始定期统计收录汉字,并将这些汉字编排在国度尺度文件中。
大陆最早的尺度,订定于1980年,称为GB2312,也便是国度汉字信息互换用编码,通畅于大陆。新加坡等地也利用此编码。
台湾则于1983年开始利用闻名的“大五码”也便是big5字库。
这两个尺度曾经深深“损害”过老一辈电脑游戏玩家的心。在许多三国游戏迷内心,曹操有别的一个名字——“变巨”。
实在这便是大五码“曹操”二字,因为尺度不同一,台湾生产的游戏运行在大陆电脑里,就有了这个惊奇的名字。
为相识决这个题目,其时还曾经有一票帮助软件,此中提供笔墨编码选择功效,让部门汉字精确表现。
也正是为相识决这些题目,1993年5月,中日韩团结研究小组正式制定了CJK(中日韩同一表意笔墨),同年国际尺度化构造公布了10646,我国也以此为尺度订定了GB13000.1-93。
3
汉字数目的大抵参考
为什么汉字的尺度,并非由中国订定,而是国际订定后,才有国度尺度呢?这是由于固然汉字是中国的原生笔墨,但利用汉字的国度,并不限于中国境内。
最典范的便是日本、韩国、越南,他们的笔墨,或是同样叫做“汉字”,或是在写法、发音、字义等偏向,显着带有汉字的特点。
“密”字当选日本2020年度汉字
于是iso字库的泉源,也包罗着这些国度;除此以外,外洋另有大量中国古籍文献,列国或是拥有汉字文化研究构造,或是与国内汉字研究构造互助,也定期向iso报告新的汉字。
必要阐明的是,依据国际汉字尺度订定国内汉字字符集这一做法,一向相沿至如今。
这也就有了所谓“汉字总数目”的大抵参考尺度:
别的在2012年,我国启动了“中华字库”工程,旨在为30万个汉字、10万少数民族笔墨以及10万多个如甲骨文这种不常见的古代誊写笔墨编码,总计约50万字。
4
汉字数目的进展
中华字库50万这个数字,已经涵盖了汗青上全部的汉字。但是,这一数字并非不会增进。
我们常说,说话是一种“商定俗成”的工具,在这一点上,汉字也雷同。好比在2020年颁布的iso10646扩展字符集g中,就已经包罗了民风字biáng字。
别的在化工范畴,也有一些新造的汉字。2017年5月9日,新化学元素中文名颁布,两新造字纳入国度范例用字,分别是——
这些汉字,将是我们如今、将来网络交换、数字化交换的基石。
5
汉字输入的困难
但是,汉字多起来,我们不得不面对一个新的题目:怎样输入这么多汉字呢?
举例来说,我们常用拼音输入法。汉语拼音一共有300多个发音,gb2312的期间一共6000多字,输入一个发音,与之对应的汉字数目均匀不外二三十个。
根据输入法每行表现十个候选字盘算,翻页两三次便能找到想要录入的汉字。
但是,今日汉字数目已经到达9万,均匀每个读音下有300页候选汉字。
岂非我们要翻页300次来查找某一个想要输入的汉字吗?
我们都曾碰到过如许的题目,在拼音输入法下查找某一个字,翻究竟了还没找到,只要更过细地往回查找,大概输入一个字就要花上好几分钟。
别焦急,好方法已经有了。咱们之后找时机跟您逐步聊这个题目。
END
敝帚字珍
汉字文化博大博识,
我们常用的汉字只有不到3000个;
新华字典收录汉字约8000个;
如今的电脑手机等终端,
可表现汉字约30000个;
2005年的国度尺度GB18030-2005,
收录汉字7万多个;
而最新的国际尺度10646,
收录汉字9万多个。
汉字再多,
假如不了解、在电脑上打不出来,
这些汉字文化就都丢了。
我们要做的,便是和您一路,
查找汉字的文化。
接待您存眷:敝帚字珍。