CERNET 30周年丨中国第一个电子杂志的诞生

起源:中国教育和科研推算机网 功夫:2024-09-04

  今年是CERNET建设30年;赝骨 ,作为中国首个互联网主干网 ,CERNET不仅见证了中国互联网从无到佑注从幼到大的发展事业 ,也为高校师生群体提供了创新的舞台 ,缔造了中国互联网汗青上多多的第一。

中国第一个电子杂志的诞生

  1995年1月12日 ,中国第一个电子杂志——《神州学人》电子版(英文名CHISA ,取自China Scholars Abroad)诞生。

腾龙集团(中国)有限公司官网90301

△1995年《神州学人》电子版的主页

  承载与颁布这本电子杂志的平台是1994年起头建设的我国首个覆盖全国的互联网——中国教育和科研推算机网CERNET。“一路头 ,我们就和CERNET结下了不解之缘。”曾任《神州学人》副总编纂的许珑说。

  海表学子的呼声

  创办于1987年5月的《神州学人》是一本专门面向我国海表留学人员的杂志。

  “鼎新盛开后 ,很多中国留学生奔赴世界各地 ,但其时的通讯之难 ,成本之高 ,此刻不能思议。这本杂志像是一个感情的纽带 ,衔接着身处全球的中国留学生们 ,各人对它有着极度出格的感情。”许珑回顾。

  80年代末 ,互联网在国表大学首先鼓起 ,大学师生是最早接触互联网的群体。“能不能把国内的信息实时颁布在网上?」剽是其时好多留学生们的巴望。中央有关部门得知这样的等待 ,因而在1994年10月21日 ,有关辅导建议由国度教育委员会掌管办理此事。国度教委十吩祺沉这项工作 ,4天之后 ,就向中央递交了汇报 ,指出已起头成立中国教育和科研推算机网CERNET ,通过CERNET ,即可让国表的留学生看到国内的媒体信息。因而 ,1995年1月 ,在中央的领导和国度教委的推动下 ,《神州学人》电子版在CERNET上诞生了。

腾龙集团(中国)有限公司官网90302

△1995年 ,时任国度教委主任朱开轩、副主任韦钰等视察《神州学人》电子版

  CERNET支持CHISA的诞生

  《神州学人》电子版CHISA诞生的前夕 ,1994岁首 ,在其时国度打算委员会、教育委员会的辅导下 ,清华大学吴建平、李星等一批年轻的专家起头牵头建设中国第一个互联网主干网——中国教育和科研推算机网CERNET。

  一个无意的机遇 ,听说国度教委在筹办《神州学人》电子版CHISA ,李星立刻想到 ,能不能把这本电子刊放到CERNET上?在回国之前 ,他在国表留学8年 ,对《神州学人》很有感情。正是这样一种情结 ,使得李星极力争取 ,要把《神州学人》电子版放在刚刚建成的CERNET上颁布。

  这和国度教委的设法不谋而合 ,可能也正是许珑提到的“缘分”。其时CERNET的提议辅导之一 ,也就是主管CERNET工作的国度教委副主任韦钰 ,也分管留学生工作 ,而韦钰自己的留学经历和其“报效祖国 ,义不容辞”的留学理想 ,使得她对留学生和《神州学人》也有格表的关注和厚爱。天时地利人和 ,就这样 ,《神州学人》电子版和CERNET相伴而生。

  《神州学人》电子版启发了中国出版刊物上网的先河。对于这样的新鲜事物 ,各人感应十别离致 ,也极度包涵与支持。“我们去办理《神州学人》电子版出版手续时 ,新闻出版署期刊司说 ,这是一个全新的事物 ,他们之前也没有任何经验。让我们先办 ,也是给我国以来的电子刊摸索出一些经验。” 回顾起29年前往新闻出版署的场景 ,许珑说。

  区别于《神州学人》杂志重要颁发原创文章的模式 ,电子刊摘选汇集了其时很多媒体的精华文章。《神州学人》电子版的出版 ,重要分为两个部门:神州学人编纂部掌管内容建设 ,CERNET掌管电子刊的颁布、网页的创建、运营和守护。

腾龙集团(中国)有限公司官网90303-550

△2004年 ,CERNET网络中心李星、朱爽回首CHISA的创办

  名副其实的技术守护征询

  《神州学人》电子版最初的服务器是一台其时盛行的Sun Sparc 20工作站 ,位于清华大学主楼CERNET的机房。

  电子版的颁布由CERNET网络中心朱爽和李星教员共同实现。在昔时那极度单一 ,却极度能干的《神州学人》电子版的版权页上 ,写着一行字:“技术守护征询:朱爽 ,李星 ,chisa-tech@chisa.edu.cn ”。

  “我们名副其实 ,哈哈。”朱爽回顾说。“为了赶国表读者阅读的时差 ,选定在每周周五发刊。”

  固然设备已经是其时的最好 ,但互联网是那么新 ,全球其时的网络硬件环境、颁布技术和软件环境都刚刚起步:短短两万多字的文字内容 ,有时要花上几个幼时能力颁布实现。为了电子版的颁布和网上传布稳操胜券 ,李星和朱爽进行了大量的筹备。为保障1月12日顺利发刊 ,他们要在1月6日颁布“试刊”。在试刊的过程中 ,解决了很多技术上的幼挑战。

  最初 ,电子刊只是单一的文件体式 ,编纂部造作成磁盘 ,由专人送到CERNET网络中心 ,后来通过FTP上传到网络中心 ,再后来 ,就直接以拨号上网的方式上传到服务器了。

  在收到编纂部发来的期刊后 ,他们将当期的内容天生各类编码版本 ,蕴含GB、BIG5、HZ、T3、ISO2022-CN和Postscript等 ,这些今天我们看来极度单一的技术 ,在其时却是相当专业、超前的。经过编码后的版本被颁布到FTP、GOPHER和WWW上 ,同时以UUCODE编码邮件 ,发送到海表留学人员的订阅邮箱中。

  “无论是在表出差还是寒暑假 ,我们都想方设法地保障在周五按时颁布上线。”朱爽说。

  1995年1月15日 ,李星和朱爽到泰国参与第一届亚太地域网络信息中心会议;岷 ,在取路香港回北京时 ,正好是个周五——电子版第二期的发刊日。他们到达香港后 ,顾不上忙其他事件 ,第一功夫就去了香港中文大学网络中心 ,为的就是定时颁布《神州学人》电子版。

  “电子刊创刊仅仅几个月 ,随机浏览人数就达到了数万人 ,订阅人数有8000多个。”许珑说。一功夫 ,《神州学人》电子版成为了中国互联网上的一路亮点 ,连版权页的技术守护征询邮箱都收成了很多读者周到洋溢的来信。“有不少读者询问英文环境下阅读中文的问题 ,我们当即做了一个若何在网上阅读中文的指南。后来 ,为了方便读者查找信息 ,我们还做了具体目录分类检索。记得李星教员还时时现写一些幼的软件来援手颁布 ,好比查抄编码谬误等等。”朱爽回顾。

  在那段功夫里 ,为了让电子刊颁布得更好更快 ,他们钻研出了好多幼技巧 ,好比电子邮件会商组技术(MAILING-LIST)。后来 ,《神州学人》电子版还有了具体的目录分类。其时李星教授带的一位钻研生还针对电子版内容的特殊性 ,设计了最初的中英文搜索引擎 ,方便读者查找电子版上的有关资料。这在其时互联网刚刚鼓起的全球 ,都是极度实用、有趣的索求。

开创了一个先河

  1995年的夏天 ,时任国度教委主任朱开轩、副主任韦钰来到了位于CERNET网络中心的机房 ,视察电子刊工作的进展情况。韦钰暗示:“《神州学人》电子版是与《神州学人》杂志比翼齐飞的一份电子杂志。”

  “电子杂志颁布后 ,收到了来自全世界的声音 ,每一期内容刊发后 ,都有几百个留学生给我们发Email互动。各人把身在异国他乡的所思所感都通过互联网与我们分享 ,极度让人感动。”许珑说。

  在没有其他来自祖国的中文刊物上网的年代 ,这份来自祖国的声音弥足宝贵。其时的读者纷纷暗示:“读到神州学人电子版 ,犹如饮到了戈壁中的甘泉 ,听到了来自北京的声音。”“在国表通过《神州学人》电子版直接点击国内要闻和自己感兴致的栏目 ,倍觉亲切温暖 ,心能与祖国一路跳动。”

  《神州学人》电子版的问世 ,开创了国内里文媒体进入国际互联网的先河 ,拥有划时期的汗青意思 ,它的创办 ,立即引起了国内媒体的关注 ,中央电视台新闻联播、新华社、人民日报等媒体都迅速颁布了新闻。

  随着《神州学人》电子版影响力的增大 ,国务院新闻办公室将其纳入了国度对表新闻宣传平台。国内高校编写的新闻学教科书也将《神州学人》电子版的诞生作为开创性的汗青事务 ,编入了我国新闻发展史。

  1995年 ,美国国会图书馆电脑网络中心OCLC(Online Computer Library Center)将《神州学人》电子版正式编目 ,成为被此类大型图书馆编主张第一个中国大陆的中文新闻媒体。

  “有一次我看王幼丫主持的《开心辞典》 ,其中一个问题是‘我国最早的电子期刊是哪一家’?台下一位来自媒体的答题者很快就说:《神州学人》!我其时极度的激昂和高慢。”回首往事 ,已经退休多年的许珑说。

扩大阅读:1990年代的网络刊物刊行技术

  三十年前网络刊物刊行技术与当今并不一样。为了适应全世界各个地域读者环境的多样性 ,《神州学人》网络版刊行了分歧的大局 ,使用分歧的中文编码步骤。

  一、利用和谈

  1.邮件列表(Mailing List)

  邮件列表的发源能够追忆到1975年 ,是互联网上最早的社区大局之一 ,也是Internet上的一种沉要工具 ,用于各类群体之间的信息互换和信息颁布。

  早期的邮件列表是一个幼组成员通过电子邮件会商某一个特定话题 ,通常称为会商组 ,由于早期联网的推算机数量很少 ,会商组的参加者也很少。会商组很快就发展演变出另一种大局 ,即有治理者管造的会商组 ,也就是通常所说的邮件列表 ,或者叫狭义的邮件列表。

  由于互联网早期使用ASCII编码 ,只有7比特 ,电子邮件、域名系统(DNS)等主流畅用只支持7比特的通明传输 ,因而 ,对于中文等多字节文字(每个字节的全数8比特均需传输)必须转换成7比特字符。从而《神州学人》邮件列表选取了UUCODE编码。

  2.文件传输和谈(FTP)

  文件传输和谈(File Transfer Protocol)是在推算机网络的客户端和服务器间传输文件的利用层和谈。传送文件(file transfer)和接见文件(file access)之间的区别在于:前者由FTP提供 ,后者由NFS蹬爪用系统提供。文件传输和谈由RFC959规范。

  FTP是8位的客户端-服务器和谈 ,能操作任何类型的文件而不必要后续处置 ,就像MIME或Unicode一样 ,但FTP有极高的延时 ,意味着从起头要求到第一次接管数据间的功夫极度长 ,并且必须不断地执行一些冗长的登录过程。

  Chrome和Firefox等主流浏览器都打算弃用对FTP的支持 , 2019年推出的Chrome 82已终场对FTP支持 ,2020年疫情原因导致远程办公需要增长 ,Chrome短暂地复原了FTP ,但于2021年10月推出的Chrome95齐全移除了FTP有关代码。而Firefox原打算在版本77中终场支持FTP ,最终在2021年7月刊行的90版正式终场支持FTP和谈。微软的Edge浏览器也在2020年起终场支持FTP ,Internet Explorer 11仍保留FTP客户端 ,直到2022年6月15日终止支持。

  3.地鼠(Gopher)

  Gopher是一个互联网上使用的散布型的文件网络获取网络和谈。它是1991年由明尼苏达大学发现的。“Gopher”(地鼠)这个名字有三层寓意:第一是“挖掘信息”;第二 ,使用菜单大局网络来的信息与地鼠洞相类似;第三 ,明尼苏达大学有一支活动队名接装黄金地鼠队”。

  Gopher最初的设计指标与万维网类似:共享文档。今天的万维网险些已经代替了Gopher。但Gopher和谈还提供了一些万维网先天不足的职能 ,好比在Gopher中所有信息都以层级大局存储 ,这被以为是存储大量信息的最好方式之一。

  万维网在1991年被发现 ,由于耗用带宽较少 ,Gopher网络其时依然是极度盛行和造作良好的。1993年2月 ,明尼苏达大学颁发他们将对Gopher的使用收取牌照费 ,这就部门削减了Gopher服务器数量。一些人相信这是Gopher造成互联网汗青的原因。好多人相信Gopher的陵夷现实上是它那有限度的结机关成的 ,这种结构使得它没有自由状态的HTML网页矫捷。使用Gopher时 ,每个文档都已有一个预约义的体式和类型 ,一个Gopher用户必须通过一个服务器界说的系统菜单导航进某一个特定的文档。好多人不喜欢Gopher系统中这种报答造作的菜单和文件的分辨 ,而Web网络上使用的超文本和谈和交互式利用法式显得更为盛开矫捷。

  4.万维网(WWW)

  万维网(World Wide Web)是一个通过互联网接见的、由很多相互链接的超文本组成的信息系统。英国科学家蒂姆·伯纳斯-李于1989年发了然万维网 ,1990年 ,他在瑞士CERN工作期间编写了第一个网页浏览器。网页浏览器于1991年1月向其他钻研机构刊行 ,并于同年8月向公共盛开。

  万维网是信息时期发展的主题 ,也是数十亿人在互联网上进行交互和浏览的重要工具。网页重要是文本文件体式化和超文本置标语言(HTML)。除了体式化文字之表 ,网页还可能蕴含图片、影片、声音和软件组件 ,这些组件会在用户的网页浏览器中出现为多媒体内容的页面。万维网并不等同于互联网 ,万维网只是互联网所能提供的服务之一 ,是靠着互联网运行的一项服务。

  1993年4月30日 ,欧洲核子钻研组织颁发万维网对任何人免费盛开 ,且不收取任何用度。两个月之后 ,Gopher和谈颁发不再免费使用 ,造成大量用户从Gopher转向万维网。早期盛行的网页浏览器是用于Unix和X Windows系统的ViolaWWW。

  学者普遍以为 ,万维网的一个转折点始于1993年推出的Mosaic网页浏览器 ,这是由伊利诺伊大学厄巴纳-香槟分校(NCSA-UIUC)的国度超等推算机利用中心团队所开发的图形接口浏览器 ,由马克·安德里森辅导。Mosaic的资金来自美国高速运算及通讯打算(High-Performance Computing and Communications Initiative)和高速运算及通讯法案(High Performance Computing and Communication Act of 1991) ,这也是美国参议员阿尔·戈尔所提议的几项运算发展打算之一。在Mosaic颁布之前 ,网页中的图片和文字混归并不常见 ,万维网的受欢迎水平远低于互联网上使用的旧和谈 ,例如Gopher和WAIS。Mosaic的图形使用接口让万维网成为迄今为止最受欢迎的互联网和谈。

  1994年10月 ,万维网联盟(W3C)在麻省理工学院推算机科学尝试室成立 ,成立者是万维网的发现者蒂姆·伯纳斯-李。到了1994年底 ,全球网站数量依然相对稀少 ,但是好多驰名网站已经相当活跃 ,这些网站已经预示或者启发了当今最盛行的服务。

  二、中文编码

  1.UUCODE (uuencoding)

  uuencode这个名字衍生自"Unix-to-Unix encoding" ,原先是Unix系统下将二进造的资料借由uucp邮件系统传输的一个编码程式 ,是一种二进造到文字的编码。uudecode是与uuencode搭配的解码程式 ,uuencode/decode常见于电子邮件中的档案传送以及usenet新闻组和BBS的贴文等等。最近已被MIME大量取代。

  2.GB

  GB/T 2312 ,GB/T 2312—80 或 GB/T 2312—1980 是中华人民共和国国度尺度简体中文字符集 ,全称《信息互换用汉字编码字符集·根基集》 ,通常简称GB(“国标”汉语拼音首字母) ,又称GB0 ,由中国国度尺度总局于1980年颁布 ,1981年5月1日执行。

  在GB 2312内 ,每个汉字及符号的码位使用两个字节来暗示。第一个字节称为“高位字节” ,对应分区的编号(把区位码的“区码”加上特定值);第二个字节称为“低位字节” ,对应区段内的个别码位(把区位码的“位码”加上特定值)。

  3.BIG5

  大五码(英语:Big5 ,又称五大项目码、五大码)是繁体中文社群最常用的电脑汉字字符集尺度 ,共收录13060个汉字。

  大五码是双字节字符集 ,以十六进造暗示 ,使用双八码存储步骤 ,以两字节安放一字。第一字节称为“高位字节” ,第二字节称为“低位字节”。

  4.Postscript

  PostScript(PS)是一种页面描述说话和编程说话  ,由Adobe Systems公司于1984年推向市场。或许在这个时辰 ,史蒂夫·乔布斯参观了Adobe公司的工作 ,并督促他们改进PostScript作为驱动激光打印机的说话 ,将其增长到Canon打印机 ,诞生了LaserWriter。1985年3月 ,Apple LaserWriter是第一款带有PostScript的打印机 ,这也带来了1980年代中期的桌面印刷革命。它的技术利益和宽泛利用使得PostScript成为打印利用领域影像输出的一个选择。直到1990年代 ,PostScript说话诠释器 ,有时称作Raster image processor ,已经一度成为激光打印机的一个通常组成部门。随着使用电子方式颁布文档最终版本成为事实上的尺度 ,PostScript就在这个领域不休地被它的后续版本Portable Document Format(PDF)所超过。

  5.HZ

  HZ编码是1988年发现的编码系统。其主张是在7字节的限度下(如电子邮件)贮存GB/T 2312的双字节字符。

  其在ISO 2022编码字符的前后别离加上转义字符~{(7E 7B)和~}(7E 7D)后 ,使用正常的ASCII转码造成 ASCII 字符。部门机械也能够接受使用EUC-CN编码的转义字符。

  HZ出现于RFC 1843《HZ - A Data Format for Exchanging Files of Arbitrarily Mixed Chinese and ASCII characters》 ,作者来自斯坦福大学。

  6.T3

  T3其主张是在7字节的限度下(如电子邮件)贮存BIG5的双字节字符。

  7.ISO2022-CN

  为避开ASCII字符中的不成显示字符(十六进造为0×00至0×1F ,十进造为0至31)及空格字符(十六进造为0×20 ,十进造为32) ,国标码(又称为互换码)参考ISO 2022划定暗示非ASCII字符双字节编码领域为十六进造为 <21 21>-<7E 7E> ,十进造为 (33, 33) 至 (126, 126)。因而 ,在进行码位转换时 ,须将“区码”和“位码”别离加上32(十六进造为0×20)作为国标码。

  在这个编码模式内 ,软件必要使用低端节造字符(C0) ,高端节造字符(C1)和US-ASCII字符集(GL)标注字符属于单字节(ASCII)还是双字节 ,相对容易造成乱码(如迷失节造/转义字符)。

  ISO2022-CN在RFC 1922《互联网新闻的汉字编码》(Chinese Character Encoding for Internet Messages)中被界说。RFC1922是中国大陆的第一个RFC ,其重要作者来自清华大学。

  8.UNICODE

  Unicode ,全称为Unicode尺度(The Unicode Standard) ,其官方机构Unicode联盟所用的中文名称为统一码 ,又译作万国码、统一字符码、统一字符编码 ,是信息技术领域的业界尺度 ,其整顿、编码了世界上大部门的文字系统 ,使得电脑能以通用的字符集来处置和显示文字 ,不只减轻在分歧编码系统间切换和转换的困扰 ,更提供了一种跨平台的乱码问题解决规划。Unicode由非投机机构Unicode联盟(Unicode Consortium)掌管守护 ,该机构致力于让Unicode尺度取代寂仔的字符编码规划 ,由于寂仔规划编码空间有限 ,亦不合用于多语环境。

  Unicode陪伴着通用字符集ISO/IEC 10646的尺度而发展 ,同时也以书本的大局对表颁发。Unicode至今仍在不休增建 ,每个新版本都参与了更多新的字符。目前最新的版本为2022年9月颁布的15.0.0 ,已经收录超过14万个字符(第十万个字符在2005年获得选取)。Unicode尺度不仅仅是为文字指定代码。除了涵盖视觉上的字形、编码步骤、尺度的字符编码资料表 ,联盟官方出版品还蕴含了关于各书写系统的细节及出现方式 ,如规范化的准则、拆分、测序、绘造、双向文本显示、书写方向、字符个性(如大幼写字母)等等。此表还提供参考资料和视觉图像 ,以援手开发者和设计师正确利用尺度。

  Unicode备受认可 ,被ISO纳入国际尺度 ,成为通用字符集 ,即 ISO/IEC 10646。Unicode兼容ISO/IEC 10646 ,能齐全对应各个版本尺度。Unicode宽泛利用于电脑软件的国际化与本地化过程。好多新科技 ,如可扩大置标语言(Extensible Markup Language ,简称:XML)、Java编程说话以及现代操作系统 ,都选取Unicode来编码。Unicode最普遍的编码体式是和ASCII兼容的UTF-8 ,以及和UCS-2兼容的UTF-16。

 。ㄒ陨献柿侠醋酝纾

  起源:中国教育和科研推算机网CERNET