1、科学技术与社会发展以汉字激光照排为例引言:科技与社会的交互作用社会是如何作用于科学技术的?三角函数的成立经纬度的测定火炮技术的发展科学技术又是如何作用于社会的?俄罗斯的领土扩张美国的西部开发满清帝国的建立日本全国的统一一、汉字激光照排系统的产业化1.“748”工程的提出背景2.汉字照排系统总体设计单位的确定3.激光照排系统原理性样机的研制4.原理性样机改进工作的启动5.迎战海外激光照排系统“联军”6.夺得汉字激光照排系统的霸主地位1.“748”工程的提出背景欧美办公自动化的刺激电子计算机问世之初,主要用于数值计算,而不是文字信息处理。上个世纪60年代,集成电路技术取得突破,其后不久,计算机的应
2、用便由数据处理扩大到文字处理。不过,那时的计算机只能用于英文的输入、显示和输出。欧美国家使用计算机进行文字输入、编辑和输出处理之后,极大地提高了办公效率。这对使用汉字的中日两国形成了巨大的刺激。日本启动汉字信息处理研究日本早在60年代末便开始展开汉字信息处理方面的研究。当时,欧美研制的计算机设备,不要说用来处理千多个日文汉字了,即使用来处理96个日本假名都很困难。这意味着,日本欲解决汉字信息处理难题,必须抛弃欧美国家的众多标准计算机设备,针对汉字信息处理的特殊要求自行研制一批硬件设备和专用软件。由于需要解决的技术难题太多,故日本政府于1971年启动了为期十年的“图像信息处理系统”大型研究计划。
3、中国与日本的早期交流1972年尼克松访华,打开了中美交流的大门,也促进了中日之间的交流。1973年,新华社派出了一支技术考察团对日本共同社、日立、NEC、松下、写研、高千穗、东芝等公司进行了一个多月的考察。之后,四机部,即后来的电子工业部以及北京市科技局先后邀请日本高千穗、电子产业、大仓和富士通等厂商来华就汉字信息处理系统和电子照排设备的研制技术问题进行了座谈。这些交流对推动我国汉字信息处理研究工作的开展无疑起到了一定的促进作用当时出版业面临的难题我国的新闻出版行业当时仍在大量使用工作繁重、效率低下,且易中毒的铅字排版方式。采用照排技术,不仅可以大幅度提高工效,减轻劳动强度,而且还可以节约大量
4、有色金属。据调查,当时全国有铸字合金铅二十万吨,铜模二百多万付,时值六十亿元。不仅如此,国家每年还要给新闻出版行业补充消耗铅五千吨,铜模九千付。采用汉字照排,告别铅字,节约下来的资金已足以用于新技术装备的更新当时报刊发行面临的难题采用铅字排版印刷,排好的版无法在异地同时印刷,从而使讲究时效的报纸的发行量受到了很大限制。因此,报社对开发照排系统的呼声尤为急迫。特别是新华通讯社,每天都编辑、播发大量的新闻,如何提高加工效率,缩短时间,减少繁琐工序和减轻劳动强度,一直是新华通讯社技术改造所追求的目标,在1974年前后,新华通讯社就提出了采用电子计算机技术改造全社收、发、编、印的指导思想当时信息处理业
5、面临的难题国家计委因筹建国家经济信息及统计中心之需,要求主管计算机产业的四机部承担该中心的设计任务。四机部认为,如果不解决汉字信息处理问题,该中心很难实现计算机化管理。“748”工程的三个子项目当时,政府有关部门确立的“748”工程的三个子项目为:(1)汉字精密照排系统;(2)汉字信息检索系统;(3)汉字新闻通信系统。2.汉字照排系统总体设计单位的确定海外胶印技术的发展与第一代的手动式光学照排机不同,第二代的光学机械式照排机不需要人工逐字进行拍照,它可以在计算机的控制下实现连续照排。可是,这种照排机结构复杂,机械加工精度要求高,且仍未解决排版问题。60年代中期问世的第三代照排机,即阴极电子射线
6、管式照排机虽然机械动作少,具备排版灵活性,但幅面小,需要剪贴,而且荧光屏光度低,需要用高感光度特殊胶片。研制中的第四代激光照排机当时,英国蒙纳公司正在研制第四代照排机激光照排机。第四代照排机采用点阵式字模,输出时,从计算机存储器中调出所需文字字模,然后用激光束直接扫描,在底片上打点成字。第四代激光照排机的优点是文字质量高,输出速度快,适用面广,对底片的灵敏度要求不高等。而且点阵式字模的存储和计算机的存储技术完全兼容,可以随着计算机技术的进步,分享由此带来的一切成果。汉字胶印技术瓶颈60年代末,我国已有不少企业与大学和研究所合作,启动了第二代或第三代照排机的研制。不过,这些照排机使用的都是模拟式
7、汉字字模存储。由于汉字数以万计,而且还存在字体和字号问题,故汉字字模数量非常庞大,以致第二代和第三代照排机在我国都很难实用化汉字激光照排绕不开压缩技术的开发调研组收集了大量国内外关于照排技术的资料,进行了总体方案的研究并分析了主要的技术难点。经过近一年的调研,提出了一个64*64点阵字库的系统方案,但由于汉字点阵精密度不够,这个方案很难满足我国新闻印刷出版的要求。汉字照排系统的技术难点很多,但最关键的是解决汉字大容量字模库的存取问题,汉字有宋体、楷体、仿宋、黑体等多种字体,每种字体有7号到特大号等多种字号,使得汉字字库容量达到上亿字节,“汉字不压缩不行”王选与748的初次接触“748”工程启动
8、之时,北京大学无线电系教师王选仍病休在家。当他从夫人、北大数学系教师陈堃銶那里听到“748”工程时,已是1975年。尽管他对“748”工程中的精密汉字照排系统子项目甚感兴趣,但国内已有5 路人马在从事相关研究。作为一名年龄已满38岁的助教,他能够竞争过这些强劲对手吗?由于病休中的王选可自由支配的时间比较多,故他还是抱着一试的心情开始了前期资料的收集.直接搞四代机通过大量研读外文资料,王选对各类照排机的结构特点有了比较准确的把握。他意识到,精密汉字照排系统的开发很难绕开汉字字模的存储难题,为此,有必要直接从西方正在研制的,采用计算机存储和激光照排技术的四代机入手。也即,应跳过光机式二代机和阴极射
9、线管三代机。问题是,直接搞四代机,如何才能解决汉字字模的存储等众多技术难题呢?日本压缩方案NEC、京都大学等70年代初开始尝试使用字元组字的方式来解决这一难题。即把汉字看成是由一个或多个字元组成的图形,每个字元都用折线轮廓来加以描述,并将其轮廓信息存储到系统中,字形还原时先从系统中调出字元轮廓信息,然后把它们拼成汉字。例如“新”字,可由“立”、“木”、“斤”三个字元经放大、缩小、拉长、压扁处理后拼成。采用这种方式,字形信息的压缩率确实比较大,但是拼出来的汉字质量比较差王选的压缩方案为解决汉字字模的存储难题,王选找来报刊杂志以及有关研究报告,开始琢磨汉字字形的特点和规律。他注意到,汉字虽然繁多,
10、但其基本笔划并不多,而且这些基本笔划可以归并为横、竖、折等规则笔划和点、撇、捺等不规则笔划两大类。其中,规则笔划约占汉字笔划总数的一半以上。即使是不规则笔划,其轮廓曲线也并非毫无章法。针对汉字的这些特点,王选设想用轮廓来描述点、撇、捺等不规则笔划,用参数来描述横、竖、折等规则笔划的长宽倾斜度以及各种笔峰,以大幅减少汉字字模的信息量北大自选课题1975年5月底,王选写出了“全电子照排系统”的建议手稿。该建议上报后,引起了校领导的高度重视。随后,北大开会决定将汉字照排系统的研究列为校内自选项目,同时决定从各单位抽调人员组成会战组,协作攻关,力争拿下“748”工程中的汉字照排系统项目王选方案受阻19
11、75年10月末11月初,经过精心准备的王选夫妇代表北大参加了北京市出版办公室召开的汉字照排系统方案介绍和论证会。尽管王选在会上极力主张采用数字式字模信息压缩方案,但他的建议并没有被采纳。不过,新华社的王豹臣,“748”工程办公室的张淞芝等人对北大的方案产生了兴趣,并及时向四机部计算机工业管理局副局长、“748”工程办公室主任郭平欣作了汇报在与各方进行接触过程中,郭平欣等人意识到数字式字模压缩存储技术前景更为广阔。王选方案具有技术可行性1976年5月3日,郭平欣列出10个汉字“山、五、瓜、冰、边、效、凌、纵、缩、露”要王选演示信息压缩还原成点阵的模拟实验,主要是想实际检测一下不同风格和框架的汉字
12、的压缩率以及复原后的文字质量。并表示一个半月后要来看演示。1976年6月11日,电子工业部“748”办公室主任郭平欣,张淞芝,王豹臣以及新闻出版总署副局长沈良等人来到北大计算中心参观表演,北京大学的演示实验进行得非常顺利,结果也比大家预料的好很多。王选方案复活当时,中科院和电子工业部直属的一些计算机研究所正致力于通用计算机系统的研究开发,无暇顾及汉字信息处理系统的研制。而北京大学不仅提出了后来所称的矢量描述字模轮廓的信息压缩技术方案,而且还可以从当时的无线电系、数学系、物理系、中文系、印刷厂等单位抽调有志于这项综合性系统技术研制的人员,组成有技术优势的项目组。经过多次协调,在当时的北大校长周培
13、源以及“748”工程办公室主任、电子工业部计算机工业管理局局长郭平欣等人的支持下,“748”工程办公室于1976年9月正式决定选择北京大学作为汉字精密照排系统的总体设计和研制单位然而,任务的下达很曲折:由于北京市发了三个打印文件,明确指出“748”任务下达给新华印刷厂,并采用二代机方案。这样再在北大另搞一摊就很困难;还有,当时正值“四人帮”反对“条条专政”时期,电子工业部无法给北大直接下达任务,必须通过北京市。后来,通过郭平欣的努力,1976年9月8日,经电子工业部副部长的同意,郭平欣签名给北大发出一封信,这才算给北大正式下达了研制任务。由于种种原因,二代机方案未能放弃。从1975年到1982
14、年,北京存在两个“748”,一个是郭平欣局长领导的“748”,一个是北京市的“748”。3.激光照排系统原理性样机的研制国内内存技术落后汉字照排系统项目启动之时,国内尚未实行改革开放,要得到一些进口元器件和设备相当困难。因此,只能采用国产元器件和设备。当时国内自行研制生产的DJS130计算机,内存只有64KB。至于外存储设备,配置也很低,如国产磁鼓的最大容量只有500KB。在如此简陋的条件下,使用轮廓加参数来描述汉字字形信息,其信息量仍然显大。因此,王选等人不得不知难而上数字式汉字字模信息高倍率压缩存储与字形的快速还原难题基本解决之后,王选等人遇到的第二大技术难题便是精密汉字输出装置的研制输入
15、设备的改进当时,王选了解到邮电部杭州通信设备厂研制的整版报纸传真机已经问世,并已开始在人民日报社投入使用。不过,其分辨率只有24线/mm。王选请教物理系的张合义后得知,可以将这种报纸传真机的录影灯光源改成激光光源,进而把分辨率提高到29线/mm。问题是,这样一来,一版报纸的信息量接近20MB,任何存储器都无法容纳这么庞大的信息量。逐段生成与多路扫描后来,王选等人想出了逐段生成字形点阵等办法,才解决了激光扫描设备连续输出的难题。随后,北大项目组又将一路激光扫描改成了四路激光同时扫描,将文字输出速度一举提高到每秒60个,从而使照排机的输出速度基本上达到了实用标准与蒙纳公司的竞争在北大项目组全面展开
16、汉字激光照排系统的研制之时,英国蒙纳公司(onotype,又译莫诺公司)研制的西文激光照排系统已于1976年投产。之后,蒙纳公司又在香港学者乐秀章等人的支持下,开始研制中文激光照排系统。1979年初,蒙纳公司通过商务印书馆香港分馆向国家出版局等单位提出,希望当年能到北京和上海举办中文激光照排系统展览,并洽商设备转让、人员培训以及合资建厂等问题。在国家出版局的推动下,中国政府决定同意蒙纳公司于1979年10月来北京和上海举办为期两周的展览北大项目组别无选择,必须赶在蒙纳公司在中国举办展览前研制出原理性样机,并至少输出一份报刊样张,以证明中国不通过进口也能解决汉字激光照排问题。4.原理性样机改进工作的启动5.迎战海外激光照
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1