李星:CERNET 30年创新回顾与展望
中国教育和科研计算机网 2024-12-20
李星 CERNET网络中心副主任、清华大学教授
今年是我国全功能接入国际互联网30年,也是中国教育和科研计算机网CERNET建设30年。
30年前,机缘巧合,我从互联网的使用者转变为互联网的建设者、研究者,与CERNET紧密绑在了一起。
从互联网的使用者到建设者
1983年,我从清华毕业后去美国留学,当时互联网正在美国兴起。我们学校数学系的计算机最早连接了互联网,我找到了负责的教授,自报家门,希望能得到一个上网账号。就这样,我成为了互联网的使用者。
非常有趣,我最早上网的第一台计算机运行的是Unix操作系统,这台计算机叫King(国王),还有两台计算机叫Queen(红桃皇后)和 Rabbit(白兔先生)——都是《爱丽丝梦游仙境》里的角色,因为这本书的作者是数学家,而计算机在数学系。后来,在建设CERNET的时候我也沿袭了这种命名思路——互联网无边无际浩如烟海,海纳百川有容乃大。我给计算机取名为Sea(大海)、Ocean(大洋)、Lake(湖泊)、Pond(池塘),还给CERNET最早的电子邮件服务器取名为 sea.net.edu.cn。
在加入CERNET之前,出于兴趣,我还做过一些小的软件。1990年,我利用闲暇时间用C程序编写了一个免费软件“MacHanzi”(Mac汉字),从而可以在苹果电脑(Macintosh)没有中文操作系统的情况下阅读简体和繁体中文网络杂志。这个软件曾排进了美国斯坦福大学Mac免费下载软件排行榜的前50名,这使我在中国留学生群体中小有名气。
1991年,我回到了清华大学电子工程系任教。回国后没有互联网,非常不适应。于是我到处鼓吹互联网的好处,说多了大家都以为我是网络专业的。所以我说我参与CERNET是阴差阳错,票友下海。
上世纪八十年代末,清华、北大、科学院自动化所分别成立国家重点实验室后,共同建议在中关村建立联网试点,在国家计委支持下启动了NCFC(National Computing Facility Of China)。1994年中国大陆的第一个全功能互联网的网络就是NCFC。但是,NCFC并不是全国范围内的网络。时任国家教育委员会副主任韦钰想要继续发展教育系统联网,也得到了国家计划委员会科技司司长姜均露等领导的大力支持,设立了CERNET示范工程项目。CERNET项目由全国10所高校承担,清华大学牵头。国家教委成立了CERNET管委会,由科技司领导、主要承担院校主管领导等组成。清华大学梁猷能副校长任主任,北京大学迟惠生副校长等任副主任。同时成立了CERNET专家委员会,清华大学吴建平教授任主任,我有幸成为专家委员会成员。
CERNET重要创新回顾
初期,清华参与CERNET工作的几位老师主要来自计算机系、计算中心、电子系、自动化系等各院系部门,一开始也没有集中的办公地点,但学校非常重视,后来组建了专门的网络中心。梁校长说,一定要有一个好的环境,就把清华主楼一进门中厅最好的办公地点给了我们,非常具有标志意义。
为了筹建CERNET,清华大学成立了“中国教育和科研计算机网”项目小组,负责起草项目建议书。我们提交建议书后,很快批复就下来了。
建议书里明确了CERNET的设计和建设策略:独立设计、自主实施 ;统一规划、分步实施、近期目标明确 ;坚持先进性、开放性、标准化的原则;调动各方面的积极性,短期支持、长期自立;强调应用和服务,广泛的国际合作,严格的用户使用原则和违约处理原则。
其中,第一条很关键,那就是要独立设计、自主实施。实际上,在建设之初,IBM、加拿大北方电信等外国公司提出,如果我们购买他们的设备,他们就帮我们建网。当时,在吴建平老师的带领下,CERNET专家委员会坚持核心技术必须要掌握在自己手里的思想不动摇,拒绝了这个提议,开始自己设计和建设网络。
在几次关键时刻,CERNET专家委员会都做了重要而正确的决策。比如刚开始建CERNET时,异步转移模式(ATM)非常火,被学术界和工业界主推。但专家委员会研究后,认为ATM不可能是未来的方向,于是顶住压力选择了TCP/IP,时间也证明了这个决策的正确性。
1994年,我进入CERNET网络团队之后,开始分管NIC(网络信息中心),后来NIC和NOC(网络运行中心)一起管,这对我的挑战非常大。因为在此之前我基本上还是网络技术的外行,路由配置、地址分配的知识全部要现学,我就一点一点看材料,再具体实践。
CERNET支持了中国互联网早期的很多应用,如开通中国第一个电子杂志《神州学人》的网页版、支持了中国大陆第一个大型BBS水木清华,中国第一个开放源码站点(SUNSITE)等。
《神州学人》(1995)
清华大学SunSITE开放源码服务(1995)
1996年,“九五”攻关启动了,CERNET承担“计算机信息网络及其应用关键技术研究”的任务,基于建成的CERNET示范工程对计算机信息网络及其应用关键技术展开研究。项目涉及网络互联、管理和安全方面的六大核心技术攻关,在搜索引擎、网络管理系统、防火墙等方面填补了国内空白。
搜索引擎研究课题选择了三所高校来实施——清华大学、北京大学和华南理工大学。我们做了网络指南针(Net-Compass)搜索引擎,北京大学做了天网搜索引擎,华南理工大学做了木棉搜索引擎。这是中国最早一批搜索引擎。
1997年,我们做了一个网络管理系统,这个系统现在还在运行。互联网中有很多概念需要去理解,写程序是最好的方法之一。当我真正写了网管系统之后,对它互联网体系结构的理解就更上一层楼了。
1998年,全国高校招生系统在CERNET上进行网络招生获得了成功,从此开启了中国网上高招的历程。网上录取是一项规模非常大的教育应用,非常有社会影响力。
同年, 我指导学生做了一个叫做“顺风耳”(Cool-Audio)的视频电话,这是中国大陆第一个互联网电话应用,早于Skype很多年。
这些早期做的应用由于商业环境不成熟没能走下去,但它们都比商业应用早诞生好几年,也说明了方向的正确性和眼光的超前性。
1998年,我主持建立了中国第一个IPv6试验网络CERNET-6BONE,中国加入到了全球下一代互联网的实践环境中,培养了一大批下一代互联网人才。在这个基础上,我们还写了《IPv6原理与实践》这本书。
2004年,CERNET开始建IPv6下一代互联网CERNET2,但是面临着用什么方案建设主干网的挑战——双栈模式还是纯IPv6模式?当时国际上通行的做法都是采用双栈模式——既支持IPv4,又支持IPv6,但我们判断,要完成互联网本质的创新,就必须走一条新路。如果还沿用别人走过的路,那就还是跟随在别人后面,实现不了核心技术的突破。所以在吴建平老师的带领下,CERNET专家委员采用了纯 IPv6的技术路线,建成全国第一个,同时也是全球规模最大的纯IPv6互联网主干网。
到了2020年,美国管理和预算办公室(OMB)发布了IPv6部署和使用指南。明确提出,双栈模式未来将难以维护,要向纯 IPv6网络迁移。现在回头看,纯IPv6是未来的必然趋势。CERNET从一开始就顶着各种非议一直坚持纯IPv6网络的建设,这一步无疑是走对了。
2007年,为解决网络空间安全问题,吴建平老师率领团队创新性地提出了下一代互联网源地址验证体系结构SAVA关键技术,获得了2023年国家科技进步一等奖。
互联网的开放和安全很重要,吴建平老师说:“在IPv6等问题上,要把握好开放与安全的矛盾关系,兼顾两者的同时找到务实的解决方法,依此思路来应对网络空间安全技术体系的机遇和挑战。在突破核心技术、建设网络强国的过程中,逐渐掌握国际标准的制定权、国际组织的话语权和基础设施的掌控权。”
2007年,我们团队提出无状态翻译技术IVI。IPv4和IPv6不兼容,IPv4向IPv6过渡,可以采用双栈技术、隧道技术和翻译技术。“双栈技术”不具备激励机制,因为绝大多数人都等待着别人投资进行IPv6改造。 “隧道技术”本身不独立,必须和“双栈技术”同时使用。“翻译技术”能够以更低的成本率先建设纯IPv6网络,并通过翻译器与IPv4互联网互联互通,是最好的选择。但由于IPv4协议和IPv6协议并不兼容,具有最大的技术难度。
无状态翻译IVI的基本技术概念可以归结为三点:第一,IPv4和IPv6本身不兼容,不可能真的“互通”。第二,翻译互通的基本原理是,通过翻译器将真实的IPv4计算机映射成虚拟的IPv6计算机,同时通过翻译器将真实的IPv6计算机映射成虚拟的IPv4计算机,使得在互相不兼容的IPv4和IPv6协议空间内,分别有真实的计算机和虚拟的计算机进行端对端的通信。第三,如何实现IPv4地址和IPv6地址的映射是关键。IPv6地址为128位,一个IPv6的子网就有64位,可以轻易地表示32位的IPv4地址,但如何用有限的IPv4地址表示IPv6是基于算法表示和解决的,这是IVI最大的突破点。
IVI系列技术成为了9个国际互联网标准化组织IETF的RFC,使得IPv4和IPv6互通的基本问题解决了,推动了全球互联网向IPv6单栈的演进。在总结实践经验的基础上,我们的新书《新一代IPv6过渡技术:IPv6单栈和IPv4即服务》也在今年出版了。
总的来说,在CERNET2上,我们做了很多创新。而历史上证明,这些决策是正确的。创新一定是源于对这项工作的热爱,不断思考才有创新的可能。创新要积累,要坚持,要忍得住初期的不被理解。
这里还有一项重要的机制体制创新:赛尔网络有限公司的成立。赛尔网络是CERNET在机制体制创新上的探索,对CERNET的发展起到了非常重要的作用。商业化的运行机制保障了CERNET的长远发展,光纤网络的建设也使得CERNET的网络基座更加坚实了,除此之外,赛尔网络还提供了非常好的试验环境。
2021年, 以FITI(CERNET3)为标志,CERNET建成了全球最大的未来互联网试验基础设施。
回顾CERNET的最初十年,培育了中国第一批互联网用户,第一批互联网研究者、建设者,第一批互联网创业者以及第一批互联网应用,创造了中国互联网历史上众多的第一:第一份电子杂志、第一个大型BBS站点、第一代互联网搜索引擎等,极大地推动了我国互联网的技术发展和应用探索。
CERNET的第二个十年,在技术创新中迎头赶上,逐步拥有、扩大了我国在互联网核心技术领域的话语权。2004年,全球首个最大的纯IPv6互联网CERNET2主干网建成,拉开了中国互联网的技术创新序幕,以此为平台,CERNET团队大力参与全球互联网技术标准制定领域的工作,在下一代互联网源地址验证技术、IPv6过渡技术等方面获得重大创新突破。实现了从最初阶段的借鉴与跟随国际互联网发展,跨越到对互联网核心技术与应用层面的追赶与超越。
CERNET的第三个十年,迈向了突破引领阶段。2021年4月,CERNET的第三张大网——未来互联网试验设施FITI高性能主干网开通,致力于对下一代互联网关键核心技术的探索和实践,为研究和设计各种创新未来互联网体系结构提供国际领先的开放性试验环境。2023年11月,全球首条1.2T超高速下一代互联网主干通路在我国面世,成为全球互联网基础设施发展的一项里程碑。
回顾CERNET的发展历史,同样也能看到通信技术发展的轨迹。在CERNET正式开通之前,采用的是IP over X.25通信技术,带宽只有2.4K,连接了北京、上海、南京、广州和西安5个城市6所高校。在1995年CERNET项目验收时,采用的是IP over DDN专线,带宽64K。2014年的时候采用IP over DWDM技术,带宽达到了100G。在二十年中,带宽增长了4000万倍,超越了摩尔定律。
坚持国际交流与合作
CERNET的视野一开始就是国际化的。1994年,也就是CERNET建设那年,中国迎来了第一个真正意义上的互联网国际会议——亚太先进网络学会APNG的11月会议。这次会议在清华大学甲所召开,大家讨论了APNIC成立的问题,以及中文的汉字编码问题。在会议上,大家确认了使用中国大陆的汉字编码ISO-2022CN。两年后,在会议探讨的基础上,中国大陆第一个RFC(RFC1922)诞生了。
1995年,我们参加了在夏威夷火奴鲁鲁举办的INET’ 95,这是国际互联网协会(ISOC)的第五届年会,重点讨论互联网的全球化问题。在这次会议上,CERNET管委会主任梁猷能教授、吴建平老师和我一同发表了《中国教育科研界接入全球互联网》,介绍了CERNET诞生的背景和未来发展构想。如今看来,文章中的设计理念,实施方案等在30年后的今天仍没有过时,具有很好的参考价值。文章中提到的具体网络带宽(如64Kbps),在今天看来实在低得不可思议,但在那时已经是石破天惊、打破电信垄断的壮举了。
1996年,在加拿大蒙特利尔召开的INET’ 96会议上,梁教授、吴老师和我共同发表了第二份报告,介绍CERNET的设计理念、实施状况和网络运营情况,还分析了CERNET项目的影响和中国互联网的未来。
1998年,在澳大利亚布里斯班召开的国际万维网大会第七届会议(WWW7)上,作为CERNET的设计者和建设者之一,我做了题为“中国的互联网:过去,现在和未来”的主旨演讲,探讨了CERNET的建设历程以及对未来的展望……
要在互联网技术上发力,了解IETF文化、参加IETF标准制定是必不可少的。2004年,中国的网络研究人员第一次成规模地参加了在韩国首尔召开的IETF第59次会议。当时,我们和互联网协会的组织者商量,能不能在中国也举办一次IETF会议?他们说:“IETF会议不是旅游会,而是工作会。IETF会议通常选择在美国开的原因是有大量美国工程师已经做了或者正在做互联网技术的研究。如果会议在中国举行,但来自中国的参会者寥寥,对于买国际机票去参会的工程师来说就显得奢侈了。什么时候中国的参会者足够多了,IETF会议就会很自然地去中国召开了。”
此后,中国研究人员活跃于IETF的会议,积极提交草案、参加会议、加入讨论,参加IETF 大会的中国人逐年增加了。终于,在2010年,IETF在北京召开了第79次会议,这是IETF第一次来中国。此后,自2013年IETF第88次会议以来,中国成为了全球参会人数第二多的国家。
第79届国际互联网工程任务组(IETF)大会在北京举行
我们今天看到,中国在从2004年到现在的20年间,各个领域积极参与国际互联网组织、参与国际互联网标准制定,成为互联网技术领域的中国力量。现在,CERNET群体参与制定的互联网标准已经有20多项,RFC数量排在中国的第二,仅次于华为。在近200篇RFC中,平均被引用率最高的单位是清华大学,在第一作者为中国大陆人员所发表的近200篇RFC中,被引用次数最多的也来自CERNET团队。
参与国际合作,对于我国技术人员掌握互联网核心技术非常重要。在参与国际合作与国际组织的过程中,我们让国际上了解了中国互联网的进展,同时做出了互联网核心技术的中国贡献。
今年在爱尔兰举行的IETF第121届IETF大会上,国际互联网协会将波斯塔尔奖颁给我。我说,我代表的是有幸见证中国互联网发展这一非凡历程,并为之作出贡献的一代人。这一奖项不仅仅是对我个人的表彰,更是对所有中国互联网科技工作者和CERNET科研团队的表彰,以及对中国互联网快速发展和技术进步的肯定。
2024年11月,国际互联网协会将2024年度乔纳森·波斯塔尔奖(Jonathan Postel Award)授予清华大学李星教授,以表彰他为全球互联网技术发展作出的杰出贡献
希望更多的中国科研人员加入互联网标准制定中,成为全球互联网技术的重要贡献者,为互联网的发展做出更多中国贡献。
有一些学生问我,如何在互联网领域发展?我的一个朋友曾经开玩笑地说:“网络界有两类人,一类人解决问题,但太忙了,没有时间写论文;另一类人专门写论文,但没有太多的实践经验。”我希望立志于网络研究的年轻人要有网络运行经验,并从学术研究的角度解决大问题。其次,要与人工智能相结合,与时俱进。互联网很特殊,西方的说法是,上帝创造自然界,人类创造互联网。人类设计互联网协议或创造新的应用就是像是上帝创造万物,责任巨大。然而人类不是上帝,既不完美又并非全能,所以一定要留出未来发展的空间,有所为,有所不为。
回顾与展望
美国印度裔著名统计学家C.R.Rao曾经说过,“在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的世界里,所有的判断都是统计学。”在我们回顾和展望CERNET时,也要深入互联网发展历史中,研究事物的发展规律。
人工智能和互联网都称得上人类社会最重要的发明,它们就像一粒种子所结出的两颗甜美的果实——美国军方最初的计划是研究人工智能,却一不小心做出了网络。
在ARPARNET诞生55年后,ChatGPT横空出世,生成式人工智能时代到来了。ChatGPT之所以成功,就是接入了互联网,使用了大量的数据进行训练。也可以说,没有互联网就不会有ChatGPT。
30年前,我们抓住了互联网的机会,取得了三代CERNET的成果。回想起来,我们在关键的技术节点做出了正确的决策。但是,回到当时,各种阻力、困难和困惑也是存在的。靠着为激情、勇气和对技术不断的钻研和理解走过来了。今天在人工智能时代,也会有各种阻力、困难和困惑。希望年轻一代努力奋斗,使中国成为网络强国。
今年是中国全功能接入互联网三十周年,也是中国教育和科研计算机网成立三十周年。三十年前,我们的一个梦想是让中国的每一个学生能够使用自己的计算机上互联网。今天,我们的希望是让中国的每一个学生能够使用自己大模型联网互相交流,走向充满机会和希望的未来!
本文根据李星教授采访、报告整理