第21版 高端访谈

2014年07月28日 星期一 国内统一刊号:CN51—0098     中国•企业家日报

钟林 发现汉字基因

来源:企业家日报 作者:

  人物简介

  

  钟林,师从著名经济学家林凌教授、顾宗枨教授和张泽荣教授,曾主持过多项部省级科研项目。2001年他辞去公职,成为了成都汉谷科技有限公司的创始人之一。他和他的团队始终将研究目标锁定在通过汉字拼形化来解决用语言控制机器、人机语言交互这一世界级尖端课题上。他的卓越贡献获得了国家权威机构的认可,曾被聘为中国科学院虚拟经济与数据科学研究中心的兼职研究员。

  ■ 记者 王萍 报道

  

  几年前的一天,同事将钟林带到编辑部,我们有幸了解到,有一个潜心于汉字基因、汉字数字化的科学家,苦苦钻研十余年,终于可以将成果公之于众。

  后来,在汉字数字化市场化的路上摸索前行、跌跌撞撞,到现在将市场化的工作交付他手,钟林终于想明白了,一件事情,不能只靠一个人来完成。

  时下的成都,暑热难当。钟林带着他的伙伴在玉溪的某处度假。某天,记者收到他的短信说:“今天最高气温24度。”当天的成都最高气温34度。记者在心里替钟林感到高兴,他学会了放下,学会了调整,学会了“享受”,包括工作和生活。

  ——记者手记

  

  现在的钟林,白发依旧,笑容依旧,但是身份变了。从当年的科学家、发明人,变身为中国汉字工程院院长,不变的是他要将汉字信息化进行到底的决心。

  他现在的汉谷合作模式,是通过实施技术特许,建立战略联盟关系,从而谋求快速发展。与常规做法不同的是,汉谷不要求合作伙伴支付技术特许费用,而是以获得部分合作项目(产品)的产权作为回报,相当于汉谷以其知识产权所有权出资。汉谷合作模式不要求联盟各方进行实质性的融合,即不组建新的公司,因为整个项目(产品)开发工作完全由合作伙伴独立承担并完成,汉谷既不参与也不干预。这是一种优势互补、风险共担、要素双向或多向流动的松散型网络组织。

  在过去十几年中,战略联盟是欧美企业盛行的扩张方式,当今世界大的跨国公司几乎无一不是通过联盟收购方式发展成长起来的。钟林看准了这个方向,义无反顾地走过去。

  据他介绍,通过战略联盟,以很小的代价获得汉谷知识产权使用权,减少合作风险,降低合作门槛,易于作出项目(产品)合作开发决策。在项目(产品)运作过程中,正确地评估汉谷知识产权的市场价值,为后期收购汉谷知识产权或汉谷股份提供科学依据。对于汉谷来说,通过战略联盟,可以充分地利用合作伙伴所拥有的项目(产品)运作优势,取得事半功倍的效果,这样就可以快速地实施,同时又具有相当的灵活性,符合汉谷注重速度和控制成本的要求。

  找到与大企业的共同利益,主动与其结成战略联盟关系,将强大竞争对手转化为依存伙伴,借船出海,借梯登高,以达到占领市场的第一目标并使汉谷快速壮大。实践证明,这是汉谷走向成功的一条捷径,风险小而成功率高。

  祝福钟林!祝福汉谷!

  

  找到汉字基因

  

  记者:中国汉字工程院所创立的汉字工程学,是从几何学、工程学、基因学、信息学的角度对汉字结构进行研究,发现了汉字基因和汉字字母,提出了汉字拼形方案。请教授解释一下“汉字基因”和“汉字字母”。

  钟林:“汉字基因”是“汉字字形基因”的简称,是指构成汉字字形最基本的因素。按照科学分析要求,我们分解汉字字形,直到不能再分解为止,最后得到的是横、竖、撇、捺,它们才是构成汉字字形的基因。折笔并不是汉字基因,因为折笔还可分解为横、竖、撇、捺。

  自汉字诞生以来的几千年间,从未有人将折笔如此拆解过。人们因而无法发现汉字基因,更无从揭示汉字基因的性质、关系及其规律性,对汉字的理解与应用,只能停留在说文解字这一艺术表面,而不能深入到基因及其组合这一科学内核。汉字非但不能发挥出应有的、巨大的威力,反而显得难认、难解、难写、难查、难记,差点被近现代文化运动和新科技革命所湮灭。

  “汉字字母”是“汉字拼形字母”的简称,是指一个汉字基因或者两个汉字基因的最简组合,它们是构成汉字字形最基本的单位。虽然汉字字母的形状比英文字母的形状丰富得多,但是,当我们以最后一个基因为标准对其分类时,汉字字母统统归类为一画横、竖、撇、捺和两画横、竖、撇、捺。这8个汉字字母可以构成全世界所有汉字,既包括繁体字、简体字、异体字,也包括中国汉字、日本汉字、韩国汉字,甚至包括古汉字。

  我们研究发现,世界上任何文字都是有字母的,汉字也不例外。不过,与拼音文字不同的是:第一,汉字字母只能拼出汉字字形,却拼不出汉字字音。第二,汉字字母不是明显存在的,需要我们采用科学的方法将其提炼出来。

  我们发现的4个汉字基因和8个汉字字母,其数字表达均呈2的次幂形式,这说明汉字字形与宇宙同构、与易经同源、与电脑同理,它们都是有序的,其有序性均表现为二进制特征。

  

  汉字数字化进程

  

  记者:2008年3月,在11届全国人大第1次会议上,16位全国人大代表联名向全国人大常委会提交了一份议案,建议国家以汉字拼形方案为主体内容制定《汉字数字化方案》。时间过去六年了,进展如何?

  钟林:建议案提交后,因方案和时机均不成熟而被搁浅。在这六年当中,我们提出了完整的《汉字字母表》和《汉字拼形方案》,比原来《汉字数字化方案》的层次更高、涉及面更广,不仅涉及到汉字信息化处理和应用,而且涉及汉字现代化教育和传承,使其与《汉语拼音方案》并列成为两大中文基础工具。目前的方案和时机均已成熟,我们将提请全国人大代表向全国人大常委会提交《关于制定和推行汉字拼形方案的建议》。

  记者:“钟林和他的团队始终将研究目标锁定在通过汉字拼形化来解决用语言控制机器、人机语言交互这一世界级尖端课题上。他的卓越贡献获得了国家权威机构的认可,曾被聘为中国科学院虚拟经济与数据科学研究中心的兼职研究员。”请问,这里说的“国家权威机构”是指?

  钟林:这里说的“国家权威机构”是指国家汉办、中国科学院、商务印书馆。

  国家汉办有关负责人表示,要逐步将《汉字拼形方案》及《汉字字母表》纳入对外汉语教学内容;商务印书馆有关专家表示,拼形数码查字法是个“具有划时代意义的伟大发明”,待时机成熟时将出版《新华字典》、《现代汉语词典》的数码版;中国科学院有关专家表示,建立在《汉字拼形方案》基础上的汉字数码是一种高效率的数据算法,一种数字化计算机语言,一种多媒体用户界面,一种数字语音识别模式,它解决了中文分词、数据挖掘、信息加密、电脑编程、人机界面、语音识别、人工智能等一系列关键信息领域里的难题。

  由此可见,《汉字拼形方案》已为语言文字教育界和信息处理科技界所共同接受。现在当务之急,是国家应将《汉字数字化方案》纳入国民教育体系,以提高全民汉字应用水平,推动汉字文化科技产业发展。

  

  汉字数字化的优势

  

  记者:您研究发现,汉字转换成数字与英文相比,具有哪些优势?

  钟林:这里所说的“汉字转换成数字”不是指在计算机内部将汉字转换为二进制数字,而是指通过汉字字母的数字化,将汉字有规则、无重码、高效率地转换为十进制数字。

  所谓“有规则”是指按照拼形规则,从汉字中提取字母,再将这些字母转换为十进制数字,而不像电报码、区位码那样需要死记硬背每个汉字的数字代码。

  所谓“无重码”是指每个汉字或者词语与转换得到的一串数字是一一对应的。即是说,这串数字还可以唯一地转换回原来的汉字或词语。汉语拼音和五笔字型都无法做到这一点,因为不是每个汉语拼音或五笔编码都只对应一个汉字或者一个词语。

  所谓“高效率”是指平均两个数字就可以唯一地表示出一个汉字,这里的“平均”是说,一篇文章有100个汉字的话,按照拼形规则转换为数字后,仅有200多一点的数目字。

  通过拼形方式,将汉字转换为数字后,与英文相比,具有三大优势。

  第一,汉字转换成数字后,汉语就成了可计算的语言。对这些数字实施某种算法或确定某种规则,就产生出许多非常有价值的汉字信息处理技术。它所带来的是中文信息处理的一场革命。

  第二,汉字转换为数字后,其生成、存储、传递、处理效率比同等内容的英文快了一倍以上。它让中文信息处理效率全面超越了英文。这对提升我国国防军事实力尤其重要,因为在现代信息战中,哪怕信息的生成、传递速度快10%,也能决定整个战争的走势甚至胜负。

  第三,汉字转换成数字后,汉字终于有了序性,其数字序性比英文的字母序性更自然、更简单、更高效。

  汉字奇迹

  

  记者:您将汉字字母的组合方式称为“黄金组合”,怎么解释?

  钟林:英文指令是由提取的单词四个字母组成,中文指令也是由提取的汉字四个字母组成。每个英文指令和中文指令的字母构成都不相同。然而,将这些英文指令和中文指令统统转换为数字指令或手势指令时,我们惊讶地发现,由英文指令(包括其他文字指令)转换而来的数字指令或手势指令重复得一塌糊涂,根本无法应用。而由中文指令转换而来的数字指令或手势指令仍是各不相同。

  这些互不重复、整齐划一的控制数码或者控制手势,就是一种基于汉字拼形方案的、效率超越英文的、人人都能掌握运用的人机通用语言。只要输入或者念出这个数码或者比划出这个手势,就能指挥电脑准确地执行一项操作。

  以这种人机通用语言作为底层语言,可生成并兼容现有各种用户界面。目前流行甚广的图形用户界面既可以建立在英文指令基础上,也可以建立在数字指令基础上。中文界面原是对英文界面的汉化,现在则可在数字界面基础上发展起来,而不侵犯别国的知识产权。

  除此之外,还可独立发展出数字用户界面和手势用户界面,这两种全新用户界面是非汉字语言无法生成、非汉字国家无法应用的。前者可衍生出用数字语音准确控制机器的数字语音界面,后者可衍生出近距离准确控制机器的非触摸手势界面,二者均不依赖于键盘、鼠标、屏幕等实体界面和图标、面板、窗口等虚拟界面。

  将中文编程指令统统代之以对应的数字指令或手势指令,不仅摆脱了汉字库这一累赘,而且超越了英文编程的效率,扩展了中文编程的应用范围,统一了各个系统的操作平台,从而创造出高于微软苹果谷歌的、超越用户期望的价值。否则,以低效率、低性价比、低用户体验的软件产品去替代高效率、高性价比、高用户体验的软件产品,或者以同样产品模式去对抗微软苹果谷歌,即使做得比他们更好,都是注定要失败的。

  汉字拼形控制方案提供了一整套不同于西方且又超越西方的操作系统及用户界面基础方案和技术路线,为中央网络安全和信息化领导小组进行顶层设计提供了思路,为中国政府采用类似“两弹一星”的集体攻关方式,举全国之力,迅速发展出可用于控制一切机器设备的新一代操作系统及用户界面创造了条件。

  这一愿景如能实现,不但可以一举扭转我国操作系统缺乏自主的被动局面,而且可以创造一个全新巨大市场,使得我国软件产业和应用服务产业获得井喷式发展,更有可能引爆全球信息通讯产业格局的大变革。

  要知道,英文有26种字母,汉字才8种字母,后者只有前者的30%左右。当它们采用4个字母组合作为控制指令时,英文可生成45.69万个字母组合,汉字却只生成0.41万个字母组合,两者悬殊112倍!然而,在这种极其严苛的条件下,汉字却实现了有限指令集的不重复(无重码)字母表达。这个只有汉字才能生成的、让人无法相信的事实,我们称之为“汉字梦”或者“汉字奇迹”。

  所以说,汉字的这一字母组合方式是无比稀有的战略资源,充满无比神秘的色彩,具有无比珍贵的价值,被誉为“黄金组合”当之无愧。

  

  帮助记忆汉字

  

  记者:您认为,《汉字拼形方案》与《汉语拼音方案》具有同等重要的地位和作用。因为,汉字拼形是推行规范汉字的重要工具,强化的是人们的汉字读写能力。在您的发明问世之前,我们对汉字的记忆靠的是死记。请解释一下,《汉字拼形方案》怎样帮助我们记住汉字?在国家逐步强调汉语读写能力的当下,您的发明如果得到普及和运用,其意义将不同凡响。

  钟林:《汉字拼形方案》的核心内容是汉字字母表。汉字字母表是通过大幅度提高我们的识字效率、查字效率、打字效率和书写规范化水平来帮助我们记住汉字的。

  首先,汉字不再是孤立的、杂乱的线条组合,而是极具规律性和系统性的汉字字母组合。汉字之间存在着非常密切的血缘关系和姻亲关系,它们通过衍生、变形、组合三种方式(新三书理论),构成了汉字大家族和小家庭。通过汉字字母快速准确地拼写汉字,通过族谱关系成群结队地认知汉字,不仅大幅度提高了汉字识字效率和汉字学习兴趣,而且避免了汉字使用的混淆错乱。

  其次,将汉字字母数字化后,用“以数查字”代替“以形查字”,既不确定汉字的偏旁部首,也不计算汉字的笔画数,而是直接翻页查数码检汉字。由于同码字少,绝大部分汉字都是“一检即得”,查检任何汉字只需几秒种,使得汉字检索效率成倍提高。高效易用的数码查字法使得人们更乐于频繁地使用字词典,不仅有助于对汉字语音、语义的理解和记忆,而且有助于对汉字字形的理解和记忆。

  再次,将汉字字母数字化、手势化后,在数字键盘上输入汉字或在触屏上书写汉字的速度获得大幅提升,远远超越了汉语拼音输入,使得人们在手机、电脑上更乐于使用数码打字法或手势写字法。在以形打(写)字过程中,汉字字形的每一变化都会灵敏地、准确地反映到汉字字母及其汉字数码、汉字手势上来。因此,打(写)字的过程,既是回忆或复习汉字字形的过程,也是引导或强制人们使用规范汉字的过程。人们要是养不成规范书写汉字的好习惯,便不能流畅地享用这些高效快捷的汉字输入工具。

  有了这样一种拼形输入检索工具,人们自觉不自觉地加深了对汉字字形的记忆,掌握了规范汉字,长时间使用电脑手机,不仅不会丧失书写汉字的能力,还极大地有利于消除提笔忘字现象,并能够在使用电脑、手机的同时培养正确的汉字书写习惯,促进汉字书写与网络时代同步。

  有了这样一种拼形输入检索工具,人们遇到不认识的汉字,也能快速准确地输入,借助互联网络进行搜索、解释、翻译、组词、造句、对话、咨询、答疑等活动,动态地了解全面而详尽的汉语汉字信息。人们通过电脑、手机等移动智能终端,就可以自主地、随时随地学习汉语汉字了。

  

  不愿看到中国庄稼

  种在美国土壤上

  

  记者:胡乔木同志曾经高瞻远瞩地指出:“我们要尽可能使汉字成为一种拼形的文字。这对于尽快实现汉字的信息化,将是一个重要的进步。”请问,汉字信息化这块,咱们走到哪一步了?

  钟林:我们之所以十多年如一日地进行着汉字拼形研究,就是不愿看到中国庄稼种在美国土壤上。我们要有自己的计算机语言体系,自己的操作系统及用户界面,而这一切都需要根植在汉字文化深厚的土壤之中。在很多人看来,汉字拼形化无非就是打打字、查查字,是个小儿科,而看不到它所具有的颠覆世界信息产业格局的巨大力量。

  我们认为,汉字拼形化是汉字现代化和汉字信息化的基础设施。没有汉字拼形化,就没有高质量的汉字现代化,就没有高效率的汉字信息化。汉字拼形化包括汉字基因化、汉字字母化、汉字数字化和汉字手势化。

  我们对汉字拼形技术的研发是沿着两条主线展开的。第一条应用线是汉字拼形技术在汉字文化教育领域的应用,解决的是汉字现代化问题;第二条应用线是汉字拼形技术在汉字科学技术领域的应用,解决的是汉字信息化问题。

  先说说第一条应用线。我们与四川出版集团合作,出版了《汉字数码字典》,发布了《汉谷字典》、《汉谷速查字典》软件,还有《汉谷大字典》、《汉谷双语双解字典》、《汉谷双语双解词典》即将出版或发布。编写了《汉字拼形系列教材》,包括字母篇、单字篇、词语篇、用语篇、句型篇和语法篇,并在这套教材基础上,制作完成了中文学习机软件《汉谷学堂》。编写了《汉谷字经》、《汉谷词经》、《汉字族谱》三本汉字拼形工具书,其中《汉字族谱》第一次通过图示方式,系统地展现了汉字之间的血缘关系和姻亲关系。

  再说说第二条应用线。我们研发了汉字拼形输入法软件,包括《汉谷拼形输入》、《汉谷快速输入》、《汉谷无重码输入》、《汉谷移动输入》4大系列8个品种,以满足各种智能终端、各个操作系统、各类用户群的汉字输入需求。我们制定了《汉字拼形输入》、《汉字拼形检索》、《汉字拼形密码》、《汉字拼形数字控制》、《汉字拼形手势控制》等汉字拼形技术应用方案。其中,《汉字拼形数字控制》和《汉字拼形手势控制》两个应用方案提出了新一代全数字操作系统和全手势操作系统的基础架构,颇具价值。

  

  资源共享 合作共赢

  

  记者:贵院目前的合作模式是怎样的?

  钟林:经过了近二十年艰难曲折的研发过程,我们终于提出了《汉字拼形方案》和《汉字字母表》。我们相信,虽然汉字拼形技术有个完善并最终成熟应用的过程,市场对汉字拼形技术应用也有个认识并完全接受的过程,但是,只要政府部门的大力扶持和实力机构的强力介入,就能加速汉字拼形技术的产业化进程,让她为人类造福千秋万代。

  为此,我院提出了“内核公开、规则公示、资源共享、合作共赢”十六字推广方针,就是将我院所拥有的原创性理论、发明专利技术、计算机软件及源代码、公开出版物及内部出版物,应用方案、产品样本等自主知识产权,在已受国家法律法规保护范围内,通过中国汉谷网这一全球汉语汉字推广平台,让合作者全面、充分、深刻地了解这些自主知识产权的独特优势和潜在价值,从而高效、准确、自主地确定合作开发项目。

  这一合作模式的最大创新点,就是将合作项目的第一选择权、最终决定权、独立经营权和绝对控制权统统交给合作伙伴,让合作伙伴获得合作项目所产生的大部分利益。如此独特的商业模式,如此优秀的知识产权,如此优惠的制度安排,就是用来吸引众多企业参与到汉字拼形产权的产业化进程中来。

  我们希望这套制度安排,在为合作方创造出财富神话的同时,也将汉字拼形技术传遍全国乃至全球各个地方。而汉字拼形技术的广泛传播和迅速普及,反过来又会创造出更多的财富神话。这就形成了一个良性循环。在这个过程中,汉字拼形技术的市场价值在不断地提升,汉字拼形技术的财富效应在不断地扩大。

  当然,采用这一模式是需要胸怀、自信和勇气的。为了长远利益必须牺牲一些眼前利益,为了赢得市场必须放弃一些可得利润。不过,为了让汉字遍布世界各地、让汉字传承千秋万代,为了实现我们的“中国汉字梦”,我们必须这么做。