如今,我們用手機、電腦等電子設備處理中文信息已經(jīng)習以為常,而在40多年前,這是一件難以想象的事情。
系列報道《新中國的第一》帶您走近新中國第一個(gè)計算機中文信息處理系統——漢字激光照排。

四十多年前,我國的計算機還主要用于科學(xué)運算和國防尖端工程,系統里沒(méi)有精密漢字。報紙、書(shū)刊主要用鉛制的活字排版印刷,手工挑字、人工排版效率很低。為此,新中國在1974年8月設立國家重點(diǎn)科技攻關(guān)項目“748工程”,研發(fā)漢字信息處理系統。最難的一步,就是讓精密漢字進(jìn)入計算機。當時(shí)還在北大當教員的王選和妻子陳堃銶,參與了這項工程的研究。

北京大學(xué)王選計算機研究所教授中國科學(xué)院與中國工程院院士王選夫人陳堃銶:英文有二十六個(gè)字母,大小寫(xiě)共五十二個(gè)。我們(漢字)常用字就有六七千,至少有十幾種字號,還有不同的字體,這樣一算至少有好幾千兆。當時(shí)我們用的計算機內存外存加起來(lái)六兆多,這個(gè)存儲量當時(shí)就是一個(gè)非常大的難題。

1975年,王選用“參數表示規則筆畫(huà),輪廓表示不規則筆畫(huà)”這種獨一無(wú)二的方法,把幾千兆的漢字字形信息,大大壓縮后存進(jìn)了只有幾兆內存的計算機,這是新中國在世界上,首次把精密漢字存入了計算機。經(jīng)過(guò)四年的連續攻關(guān),王選團隊又采用當時(shí)超前的激光照排技術(shù),成功從計算機里輸出了漢字。
1979年7月,新中國誕生第一張用“計算機-激光漢字編輯排版系統”整張輸出的中文報紙。此后,從成功排出樣書(shū)《伍豪之劍》,到在新華社中實(shí)用成功,漢字激光照相排版系統成為新中國第一個(gè)計算機中文信息處理系統,后來(lái)不僅風(fēng)靡全國,也出口到日本和歐美等發(fā)達國家。

陳堃銶:他們日本說(shuō)為什么要買(mǎi)中國的?就是覺(jué)得是最好。我們中國人是很聰明的,真是,就只要我們能夠踏踏實(shí)實(shí)地干。王選有句話(huà),要走向世界,中國人有這個(gè)能力。
改革開(kāi)放40多年來(lái),王選團隊自主研發(fā)的一系列高科技成果,不僅顛覆性改造了新中國的新聞出版印刷行業(yè),也在世界范圍內推動(dòng)了中文信息化的全面發(fā)展,電子書(shū)、新聞類(lèi)應用軟件等廣泛應用在日常生活中。

北京大學(xué)王選計算機研究所所長(cháng)郭宗明:在如今大數據、人工智能的時(shí)代,我們研究跨媒體的檢索、生成等技術(shù),讓中文信息處理插上了人工智能的翅膀,使得人們的生活更加個(gè)性化、智能化。

如今,748工程已經(jīng)過(guò)去了40多年,中文信息處理的研究已經(jīng)從用計算機處理和顯示漢字字形,轉向了用計算機對漢字語(yǔ)義的理解和再生成。根據深度學(xué)習算法,計算機可以模仿手寫(xiě)筆跡造字,也可以寫(xiě)文章、作詩(shī),還能把文字、音頻、圖像、視頻,都轉化為同一標準的表達方式,中文信息處理邁入人工智能時(shí)代。
(責任編輯:蘇玉梅)