1994年4月20日,通过美国Sprint公司的64K专线,中国全功能接入了国际互联网,同年,我国第一个覆盖全国的互联网主干网CERNET开始建设。
1996年3月,在世界上第一篇RFC出现27年后,清华大学提交的《互联网消息的汉字编码》(Chinese Character Encoding for Internet Messages)被IETF作为RFC1922发布,成为中国大陆第一篇RFC文件,这也是我国第一篇信息类RFC。
此后,中国大陆的研究人员和单位所撰写的RFC数量逐渐增加,对于互联网技术开发与标准制定的贡献也逐渐凸显。尤其自2013年第88届IETF会议以来,中国始终是参会人数第二多的国家。RFC数量的增加以及参与IETF会议人次的增多,表明中国为世界互联网核心技术的发展贡献了力量,同时也提升了中国在互联网核心技术领域的话语权。
中国大陆作者发表的RFC分析
中国大陆的RFC总量
目前,IETF共发布了9443篇RFC(截止到2024年9月30日),其中,自1996年第一篇RFC发布以来,第一作者为中国大陆人员[1]发表的RFC共计188篇;第一作者为中国大陆公司的非中国大陆人员[2]发表的RFC共计159篇(如图1)。综上所述,由中国大陆的单位/个人发表的RFC共计347篇。
图1 由中国大陆的单 /个人发表的RFC分布
本文主要讨论第一作者为中国大陆人员所发表的188篇RFC(后文简称为中国大陆作者RFC)。
由中国大陆作者在1996年~2024年的各年间所发表的RFC折线图(如图2)可以看出,自1996年的第一篇RFC以来,中国大陆作者所发表的RFC数量一路攀升,于2016年达到最高点——19篇。
图2 中国大陆作者各年发表的RFC
中国大陆作者发表的RFC行业分布
企业、高校和运营商是中国在IETF发表RFC的主力军。
在第一作者为中国大陆人员所发表的188篇RFC中(见表1),有9家企业发表了116篇RFC,8所高校发表了30篇RFC,2家运营商发表了28篇RFC,1家事业单位发表了11篇RFC,3名未显示单位的人员发表了3篇RFC(如图3)。
图3 第一作者为中国大陆人员发表的RFC行业分布
表1 各单位发表的RFC数据
其中,9家企业发表的RFC共计116篇(见表2)。这些企业分别是:华为技术公司(Huawei Technologies Co.,Ltd)[3]94篇,中兴通讯股份有限公司(ZTE Corporation)9篇,北京首都在线科技股份有限公司(Capitalonline)3篇,阿里巴巴(中国)网络技术有限公司(Alibaba Group)3篇,新华三技术有限公司(Hangzhou H3C Tech.Co.,Ltd.)2篇,互联网域名系统国家工程研究中心(ZDNS)2篇,天地互连信息技术有限公司(Beijing Internet Institute)1篇,蚂蚁科技集团股份有限公司(Ant Group)1篇,深圳酷派技术有限公司(Coolpad)1篇。
表2 企业发表的RFC
8所高校发表的RFC共计30篇(见表3)。这些高校分别是:清华大学(Tsinghua University)22篇,浙江工商大学(Zhejiang Gongshang University)2篇,上海交通大学(Shanghai Jiao Tong University)1篇,北京邮电大学(Beijing University of Postsand Telecommunications)1篇,金陵科技学院(Jinling Institute of Technology)1篇,北京科技大学(Univ. of Sci. And Tech. Beijing)1篇,四川大学(Sichuan University)1篇,香港中文大学(深圳)(CUHK(SZ)&n-hop technologies)1篇。
表3 高校发表的RFC
2家运营商发表的RFC共计28篇(见表4)。其中,中国移动通信有限公司(China Mobile Communications Corporation)20篇,中国电信股份有限公司(China Telecom)8篇。
表4 运营商发表的RFC
1家事业单位——中国互联网络信息中心(CNNIC)发表了11篇RFC(见表5)。
表5 事业单位发表的RFC
3名未显示单位的人员作为第一作者发表了3篇RFC。这些RFC是RFC7140,RFC8431,RFC9183。
各单位的RFC被引用次数和平均被引用率
与学术届衡量论文的指标类似,一篇RFC被后续RFC所引用的次数是体现其重要性的关键指标。某篇RFC被引用的次数越多,既说明了其本身的重要性,又体现了作者及所在单位对互联网核心技术所做出的贡献。
在第一作者为中国大陆人员所发表的188篇RFC中,被引用次数最多的是题为“IPv4/IPv6翻译器的IPv6地址分配”的RFC6052,作者单位是清华大学,被其他RFC引用高达50次。
通过对RFC作者所在单位和被引用次数进行统计,可以看出(见表6),RFC被引用次数最多的五家单位分别是华为技术公司(94篇RFC,被引用218次),清华大学(22篇RFC,被引用196次),中国移动通信有限公司(20篇RFC,被引用34次),中国互联网络信息中心CNNIC(11篇RFC,被引用29次),中兴通讯股份有限公司(9篇RFC,被引用31次)。
表6 各单位RFC数量及被引用次数
RFC的平均被引用率(RFC的平均被引用率=RFC被引用次数/RFC数量)也是反映RFC含金量的指标之一。结合以上数据,可以计算出各单位的RFC平均被引用率(见表7)。其中,平均被引用率最高的五家单位是清华大学(8.91),金陵科技学院(4.00),北京科技大学(4.00),中兴通讯股份有限公司(3.44),深圳酷派技术有限公司(3.00)。
表7 各单位RFC的平均被引用率(RFC的平均被引用率=RFC被引用次数/RFC数量)
中国对IPv6 RFC做出的贡献
在二十世纪六十年代的互联网设计之初,设计的IPv4寻址范围为232,理论值约为40亿个地址。然而,随着网络规模的急剧增长,IPv4地址空间不足、路由可扩展性差等问题逐渐凸显,全球由IPv4过渡到IPv6迫在眉睫。1990年,IETF为解决IPv4地址耗尽、路由表爆炸等问题,启动了下一代互联网(IPng)的标准化工作。1995年,IETF选择了IPv6作为IPng协议标准。
1994年,国家启动中国教育和科研计算机网CERNET示范工程,设计者们计划在中国的大学、中学和小学都建设校园网,并通过CERNET与全球互联网相连。但当时并没有申请到未来足够让所有学生上网的IPv4地址。IPv6的出现成为一个重大契机,不仅拥有海量的IP地址,同时也给了各国对互联网技术标准做贡献、重新定位互联网话语权的重大机遇。
在中国互联网的30年里,高校、企业、运营商等积极展开了对IPv6的探索,并通过IETF共牵头发表了36篇RFC[4]。
通过对这36篇RFC的第一作者所在单位进行统计(见表8),可以看到与IPv6相关的RFC的分布情况:清华大学15篇,华为技术公司13篇,中国移动通信有限公司2篇,中兴通讯股份有限公司2篇,北京邮电大学1篇,中国互联网络信息中心(CNNIC)1篇,阿里巴巴(中国)网络技术有限公司1篇,北京科技大学1篇。
表8 IPv6相关的RFC单位分布
中国发表的RFC在世界占比分析
中国的RFC数量世界排名第六
IETF官方数据网站显示,截至2024年8月11日,根据发表RFC的作者[5]所在国家进行统计,在全球所有已发表的RFC中,中国作者所发表的RFC数量排名第六。
数据显示(见表9),RFC数量排名前十的国家依次为美国、英国、德国、法国、加拿大、中国、芬兰、日本、瑞典和澳大利亚。
表9 RFC数量排名前十的国家
*数据来源:https://www.arkko.com/tools/rfcstats/d-countrydistr.html(更新至2024年8月11日)
RFC数量排名11~20的国家依次为比利时、印度、荷兰、以色列、意大利、西班牙、瑞士、挪威、韩国和奥地利。
虽然在互联网出现27年后的1996年,中国大陆才出现第一篇RFC,并且在2006年前,这个数值一直保持着1。但随后的近20年间,中国的研究人员和单位所撰写的RFC数量逐年增加,中国作者对互联网技术开发与标准制定的贡献也逐渐凸显。
中国的RFC和互联网草案的作者数量世界排名第二
在RFC被IETF宣布为互联网标准文档之前,被称为互联网草案(Internet Draft)。所有的RFC都曾是互联网草案,但并非所有的互联网草案都会最终成为RFC。通过观察RFC与互联网草案的作者数量,可以一窥各个国家的研究人员在互联网核心技术开发领域的活跃程度。
图4来自于IETF官网,它显示了1989年~2023年各国活跃作者(RFC与互联网草案的作者)数量。从下图可以看出,代表美国和欧盟活跃作者数量的天蓝色与紫色曲线持续处于高位。
*数据来源:https://datatracker.ietf.org/stats/document/yearly/country/?showaliases=1
图4 中国的RFC和互联网草案的作者数量世界排名第二
代表中国的绿色曲线表现非常亮眼,并于2023年跃居第二位。从上图可以看出,中国作者的数量从2000年开始逐年上升,于2004年达到22名。随后,中国作者的数量急剧猛增,于2010年达到319名。2023年,中国的活跃作者数量是447名,超越欧盟,成为活跃作者数量排名第二位的国家。
这表明,越来越多的中国研究人员投身于互联网核心技术的研究,并正在努力通过制定标准提升中国互联网在世界的话语权和影响力。
世界排名领先的中国大陆单位
IETF官方数据网站收集了全世界发表了RFC的作者[6]所在的单位,并统计了每个单位发表了RFC的作者数量(如图5)。
*数据来源:https://www.arkko.com/tools/rfcstats/companydistr.html(更新至2024年8月11日)
图5 各公司RFC作者数量
截至2024年8月11日,在全世界所有单位发表了RFC的作者数量中(见表10),华为技术公司排名第二,有178名作者,占比2.52%;中国移动通信有限公司排名25,有29名作者,占比0.41%;清华大学排名43,有18名作者,占比0.25%;中国互联网络信息中心CNNIC排名67,有13名作者,占比0.18%。
表10 RFC作者数量在世界排名前100的中国大陆单位
中国大陆作者的H指数
H指数(H-index)可用于评估研究人员的学术产出数量与学术产出水平。作者的H指数越高,说明其论文的影响力越大。
H指数是指H篇文章中每篇至少有H次引用。举例而言,如果一位作者发表了5篇文章,被引用次数为9、7、6、2和1(由高到低排序),那么该作者的H指数就是3,因为该作者有3篇文章的被引用次数大于3。
据统计,由中国大陆研究人员牵头的188篇RFC共有182名中国大陆作者[7]。其中(见表11),H指数为6的作者有1名,单位是清华大学,占作者总数的0.55%。H指数为5的作者有1名,单位是清华大学,占作者总数的0.55%。H指数为4的作者有4名,其中2名作者的单位是清华大学,2名作者的单位是华为技术公司。H指数为3的作者有3名,其中2名作者的单位是华为技术公司,1名作者的单位是中国电信股份有限公司。
表11 中国大陆RFC作者的H指数分布情况
全世界H指数超过5的RFC的作者有669名,而中国大陆有2名,仅占全世界H指数超过5的RFC作者的0.30%,还有非常大的差距。
小结
互联网的发展是鲜活的,是动态性非常强的。IETF的游戏规则也是鲜活的,它摆脱了传统工作模式与规则的束缚,为一线科研人员开辟了一块自由、开放、平等的土壤,提供了高效率工作的国际环境。任何拥有新技术的研究人员都可以贡献自己的成果,测试新技术的生命活力。
中国作为世界大国和网民最多的国家,更要积极参与IETF互联网标准制定,从而做出自己的贡献,拥有更多的话语权。
历年的数据也表明,近20年来,中国的各个单位培养了越来越多的互联网技术人才,他们积极参与互联网技术研究,不懈努力,在世界互联网的核心技术领域点亮了来自中国的星火。但这还不够,在互联网核心技术领域,未来必然需要更多人才参与进来,这是实现攻坚互联网核心技术、做出互联网核心技术中国贡献的必由之路。
注:
[1] RFC第一作者为中国大陆人员的判断标准为:第一作者的所属单位为中国大陆的企业/学校/事业单位,第一作者的姓名缩写(原文为英文)显示为中文姓名,且第一作者的通讯地址位于中国大陆地区。
[2] RFC第一作者为中国大陆公司的非中国大陆人员的判断标准为:第一作者的所属单位为中国大陆公司在海外的分公司/子公司,第一作者的通讯地址位于非中国大陆地区。
[3] 括号中的英文是RFC原文中显示的第一作者的所属单位,下同。
[4] 在标题(Title)或摘要(Abstract)中显示有IPv6的RFC,均纳入统计。
[5] 一篇RFC通常有几位作者,这里统计的是RFC的全部作者,而非仅仅第一作者。
[6] RFC的所有作者,而非仅仅第一作者。
[7] 作者的H-index用该作者所有署名RFC计算。
附:中国大陆作者牵头发表的RFC编号
△点击图片即可放大查看
注:本文所提的RFC第一作者为中国大陆人员的判断标准为:第一作者的所属单位为中国大陆的企业/学校/事业单位,第一作者的姓名缩写(原文为英文)显示为中文姓名,且第一作者的通讯地址位于中国大陆地区。(本文所有数据截止到2024年9月)
撰文:陈茜