作者:约翰留着长长的胡子
现在中国第一次全国人口普查……
其实不是世界第一次使用计算机辅助的人口普查。最先用计算机的是美国,1950年的人口普查就用上了,机型就是前面说过的一边卖一边涨价最后一百多万美元一台的UNIVAC-1。
但是唐华可以确信,中国的这一次全国人口普查虽然不是第一次使用计算机,但一定是第一次使用计算机通信网。
此外,这一次全国人口普查所收集的人口信息,也要比历史上的“一普”更详细。
……
“鉴于现在全国每个省的首府基本上都通了有线电报,因此,人口普查计算机的联网工作是较为简单的。一些人口少的偏远省份或许可以不设单独的网点,但我觉得连上网也好,因为人口少的偏远省份交通往往很不方便。”
在今年初,政务院、国家统计局准备人口普查工作时,唐华对总理是这样说的。
“每省配备一台、人口多的省份配备2台计算机,标配配件是打孔卡读取机、打印机、硬盘和25M磁带机,都自带中文系统。网络系统借助现有的有线电报网,另配备3.2Kb的调制解调器——偏远地区线路质量不行的话,可能速度到不了3.2Kbit每秒,但无所谓了,偏远省份一般人口也少。”
总理看着唐华用笔在中国地图上画出的一张网。
这其实就是用现在的有线电报网为基础,勾描出来的。
总理:“人口普查结束后,政务院好像就能接收一个很厉害的系统。”
唐华嘿嘿一笑:“我国会成为世界第一个所有省份都有联网计算机的国家。而且,嗯,会在当今世界人口最多的国家,建立一个最齐全的全国人口数据库。”
这个数据库总数据容量是40G,如果用硬盘大概要4000个10M硬盘,这可做不到。
唐华给的方案是以1600盘磁带存储,需用的时候从磁带读取到计算机中。
磁带存储器还要双备份,所以是3200盘。
国家统计局看来得开辟两个办公室堆数据了。
……
虽然是比较原始的网络连接方式,但计算机还是比有线电报更快捷,因为计算机通信网的终端在省政府大楼里,甚至可能就在省委书记的办公桌,而电报的终端在邮电局里。
计算机传递的信息量比惜字如金的电报多得多。
计算机传递的信息不会出错。而且计算机传递信息可以是交互式的。
“我看这张图里面,有五台计算机是T54M,其他是T54,北京的中心计算机不止一台……这些都是什么?”总理问。
“T54M是一种中型计算机,它比T54的计算速度更快一些,重要的是存储数据的能力更高一些。”
五台服务器分别归属于东北、华东、中南、西南、西北。
这好像就是当初五个中央局的划分方式。
第十一章,普查电脑培训班
中央局全称是“中-共中央地方局”,1952年决定撤销前全国有六个地方局:东北局、华北局、华东局、中南局、西南局、西北局。
这些叫“地方局”不叫“地方分局”,它不是中央的下一级机构,而是中央在地方的分身。地方局做出的决定就相当于党中央做出的决定。
至于为什么会出现地方局这种设置,原因很简单:在革命年代,全国各地党组织之间的交通联络不畅、通信不畅。
比如抗战时期,延安和全国各地的人员交流是极其困难的,中央想派个干部到地方,得穿过炮楼封锁线,而且还不止一次。那时候大约有10%的县委书记、区委书记级干部牺牲在穿过封锁线的时候。无线电通信也不可靠,经常一整片地区和延安失联几个月。
信息交流不畅,各地的情况延安是没法详细掌握的,许多具体的决定就只能给地方党组织来做。此时又是战争年代,地方组织做的决定有时候又非常重要,因此必须赋予地方组织相当于党中央的处置权,地方局这种机构就从20年代一直延续到了建国初期。
六个地方局虽然在50年代初撤销,但它的影响其实一直持续到21世纪。今天你拿出自己的身份证,看18位数字的头一位便知道。第一位是“1”开头的,说明你出生的地方以前隶属于华北局;
第一位是“2”开头的是中-共中央东北局;
第一位是“3”字开头说明你那儿以前是华东局;
第一位“4”字开头是中南局;
第一位“5”字开头是西南局;
第一位“6”字开头的是西北局。
……
现在,除了和北京重叠的华北局之外,唐华觉得可以在全国设5个政务数据中心,其实就是5个计算机房。现在主要存储全国“一普”的人口数据,“一普”结束以后会不断扩展数据量和数据种类,最后变成行政管理、国企管理、纪律监督、经济管理、财政管理等等全都能干的综合数据服务器。
一普的人口数据,用有线电报当网线,五个分局的数据集中在政务数据中心那里,然后写入一两百到几百卷磁带,然后——火车运到北京。
现在这年代,传输速率最高的方式,就是让各地统计局把十几个装满数据磁带的木箱搬上火车,直接运到北京。
一普在普通老百姓眼里,不见得有什么特别稀奇的事情,无非是有两个干部上门来查户口了,掏出几张卡片让每个人填自己的名字年龄性别。
这些卡片记录的信息拿回去,才是开始忙的时候。
不,应该说,上海计算机所在这些标准人口卡片开印时就开始忙碌了。
“四角号码查字法,是由王云五先生发明的检字方法,用最多5个阿拉伯数字,就可以对汉字进行归类。我们现在每个人手里都有一本王云五著写的《号码检字法》。”
武汉,第一次全国人口普查中南计算机培训班。
王守珏和计算机所的两名“助教”面对台下几十名“学生”。这些学生是国家统计局和各省省委负责一普的干部。
“四角号码查字法中,有横、竖、撇、捺这些基本笔画,并称之为单笔,这是很好理解的。同时王云五还增加了一些称之为复笔的构字单位,它们是多个基本笔画的组合,如两笔交叉的“乂”、“十”等,这样的复笔称为“叉”;一撇一捺构成的‘八’、‘人’,这样的复笔称为“八”,这些复笔在汉字中也是常见的。”
“在四角号码中单笔和复笔共定义了十个,分别用0~9十个数字表示。四角号码查字法根据汉字所含的单笔或复笔对汉字编号,它是不依书写笔顺的,而是取汉字左上角、右上角、左下角、右下角四个角的单笔或复笔的笔形,这样共有四码,一个汉字用四个数字表示。这种编码方法可直接用于小键盘输入。”
“但是,我们的四角号码输入法,每个汉字是有5位数字。除了四个角的四个数字之外,第五个数字是这个字的笔画数。”
……
有汉字系统就肯定要有输入法。
现在马上可以用的是电报码输入法,六千多个常用汉字用四位阿拉伯数字搞定。
但是电报码输入法需要极大的记忆工作量,六千多个汉字和对应的四位数字之间没有任何联系,必须死记硬背。
工作时如果有一个字没背下来,就得拿起手边的册子查找,输入速度骤然降到最低。
拼音输入法加选字当然好用,几乎不需要输入人员记忆什么。
但是,现在(新)汉语拼音尚未推广开来。所以输入人员实际上还是要先学习汉语拼音。
拼音输入法的另一个问题,是占用硬盘比较厉害。即便是未加联想和词库,一个字一个字单独输入,大约也要4M的硬盘空间。
唐华已经让华为开始开发拼音输入法了,但现在未开发完毕,按计划它也不是现在就投入使用的软件,而是要等主流硬盘容量再加倍之后。
五笔输入……那还得先发明五笔规则。
相比之下,四角号码输入法算是电报码输入法的改进版。它用的是5+1位数字,比电报码输入法多1(2)位,但熟练工也可以达到40~60字每分钟的输入速度。
上一篇:重生之老婆孩子热炕头
下一篇:华娱之黄金年代