简介

        院士口述故事是通过院士口述、组织访谈、史料编纂等方式,以挖掘整理广大院士在科研生涯中亲身经历的中国科技界的重要事件、所承担的重大创新成果以及为国家科技事业作出的贡献为重点,以“小故事”的呈现方式,通过多媒体相结合的传播形式,面向公众传播,弘扬科学精神,展示科学家风范,扩大中国科学院和学部的社会影响。

王 选:汉字激光照排系统研制的最初岁月


时间:2017-05-18作者:王选

  近来不少人问我,当初你是怎么想到要搞激光照排系统的。其实,我投入到精密照排的研制工作有一定的偶然性。

  1975年春,陈堃銶(编者注:时任北大数学系教师)参加北大校内的一个调查组,调研学校行政管理、后勤、物资、财务和印刷厂等部门采用计算机、实现自动化的可能性。从调查中得知,北京新华印刷厂和清华大学已合作搞了一个光机照排机,即二代机(编者注:光机结构照排机,photo-mechanical typesetter,由小型电子计算机和照相排字机组成的排版机)。该设备曾试排过一些出版物,但机械故障多,一行字内常常出现高低不齐的现象,因而无法实际使用。调研中还第一次听说,国家有一个748工程,即汉字信息处理系统工程,分三个子项目:汉字通信、汉字情报检索和汉字精密照排。1975年5月,748工程办公室张淞芝与十五所(编者注:电子工业部十五所)、南京大学等承担单位的同志一起来到北大介绍该工程的情况。

  在748工程的三个子项目中,我独钟精密照排系统。因为我觉得,对于通信而言,汉字与西文无多大差别,不会有什么特色;而情报检索系统虽然价值大,从长远看有很大的发展前景,但当时中国的硬件条件、联网和使用情况还不足以使这类系统在较短时期内形成一个大的气候。尤其重要的是,情报检索系统的关键之一在于建大容量的库,只有出版采用计算机系统后,才能方便地获得建库所需的信息,特别是文献的全文信息。汉字精密照排的难度是显而易见的,正是它的难度和价值吸引了我。我当时病休在家,每月领40多元的劳保工资,但却可以自由选题,可以作自己想做的任何事情。这一事例也说明在可能的条件下,让年轻人自由选题,做自己喜欢做的事情,才能激发创造的欲望。

  我搞研究工作有这样一个习惯,在一个项目开始之前总要了解清楚国外的研制现状和发展动向。为此查阅了照排系统方面的有关文献,以及Graphic Arts Monthly (编者注:《图像艺术月刊》)印刷杂志上的报道。这些调查对后来选择方向起了重要作用。当时还处于闭关锁国时期,不像现在大家都很注意国外的动态。我在中国科技情报所借阅杂志时发现我常常是那些杂志的第一个借阅者。当时的条件是艰苦的。车费是不便报销的,从中关村到地处和平街的情报所为二角五分,但少坐一站就可省五分钱。我们的工作后来列入北大自选项目,但经费是没有来源的,因此复印资料时很谨慎,对于字数不多的页,常常靠手抄来节省复印费。

  经过对国外状况的调查,我于1975年得出下述结论:数字式存储将占统治地位;光机式二代机,尤其是汉字二代机,难度很大,但没有前途;字模管式三代机和飞点扫描式三代机正在走下坡路,很快将被数字存储的阴极射线管式三代机所淘汰。

  一旦选择了数字存储的方案,汉字字型信息量太大,马上成为十分突出的问题。Digiset的黑白段描述方案压缩率低,日本京都大学的字根组合方案压缩率高但质量不好。由于我是数学系毕业,所以很容易想到信息压缩,即区分横竖折等规则笔画和任意形状的不规则笔画,并用参数描述规则笔画的宽度、长度和各种笔锋,也就是后来的轮廓描述和参数描述结合的汉字字型信息压缩方案。

  1975年5月的一个晚上,北大校革委会负责人、8341部队军代表魏银秋召集数学系、无线电系、图书馆和印刷厂有关领导开会,会一直开到半夜,确定了“数字存储、信息压缩和小键盘输入”的总体方案,先作为北大自选项目,并争取列入国家748工程的计划。会上决定成立了协作攻关的会战组,后来就称为“748工程会战组”。

  万事开头难,会战组的组建是很不顺利的。数学系比较积极,派了陈堃銶、丁霭丽参加软件研制;中文系则派李一华、陈竹梅、石新春参加字模和输入方案方面的工作。其他系均不积极。会战组从1975年5月筹建,直到1977年4月,始终缺乏计算机方面的教师。我的编制在无线电系,但我是 “吃劳保”的病号,无人管我,那时我也没有任何杂事,1976年一年可以集中全部精力来完善总体方案。

  1975年时我们打算采用阴极射线管(CRT)输出方案,但国产高分辨率阴极射线管尚未过关,幅面也很小;高灵敏度底片也无人研制;另外我从文献上看到,为保证CRT高质量输出,需研制一整套复杂的校正电路,我们对此毫无经验。输出设备一直是困扰我们的严重技术困难。

  1976年4月初我听说邮电部杭州通信设备厂研制成报纸传真机,分辨率为24线/毫米,已用于《人民日报》报纸传真,其印刷质量符合报纸要求。很快我在北京的一次展览会上见到了这一设备,回校后询问物理系光学专家张合义:北大是否有能力把该设备的录影灯光源改成激光光源,以进一步提高输出质量,满足更高的书版质量要求。张合义的回答是肯定的。

  但激光输出的控制器有严重的技术困难。当分辨率为742线/英寸时,一版报纸的点阵信息量近20MB。而杭州通信设备厂研制的传真机不能走走停停,一旦扫描开始就要连续不断高速提供点阵信息给扫描头。如何用一台500KB的磁鼓,两个32KB的交替访问的磁心存储器,使控制器在每页报纸扫描开始后,能够连续不断地高速提供多达20MB的一版版面点阵,而且两页之间还不许有长的停顿,成为几个月来折磨我的技术难题。

  经过冥思苦想,终于在1976年7月构思出挑选式读字模压缩信息送磁鼓、字模压缩信息送磁心存储器和分段生成字型点阵并缓冲的方案。一个汉字字型每次只生成8条扫描线,每次只缓冲一版报纸的8条线。字模压缩信息的高速复原是靠专门硬件完成的,一个96x96点阵的五号字需反复分段复原16次;但由于速度很快,平均仍能得到约150字/秒的复原速度,能赶得上滚筒扫描的输出速度。这一难关找到解决办法后,我们于1976年8月决定采用激光输出方案。

  (节选自《王选文集》,北京大学出版社,2006年)

© 1996 - 2015 中国科学院 版权所有 备案序号:京ICP备05002857号 地址:北京市三里河路52号 邮编:100864