我局官微“上海统计”已开设专栏“理论应用”,内容聚焦前沿理论、立足全球视野,以传播现代统计方法、实践和成功案例为主,助推统计人科研水平提高和统计事业的改革发展,欢迎大家及时关注分享。
本期推送“基于二分网络的知识复杂度”,原文是发表在《Information Sciences》上的论文“Knowledge complexity based on coupled equations within the bipartite network”。复杂知识通常指隐性、难以传播、并且难以习得的专业领域智识。事实上,国家的核心竞争优势、产业结构优化、全球价值链地位通常被认为与复杂知识的产出多寡紧密相关。然而,在如今强调“增效提质”的时代,我们或许更应该关注复杂知识的“质”而不仅仅是“量”。问题在于,过去对于复杂知识的考察大多只求“多寡”;这意味着不同专业领域知识的“异质性(Heterogeneity)”和“关联性(Interconnectedness)”被忽略,因此复杂知识的“质”的功效也在很大程度上被抹平。
基于二分网络的知识复杂度则允许我们从宏观、联系的视角考察复杂知识的产出以及关联情况,并将知识的“异质性”和“关联性”纳入考量,并为进一步描述性统计分析以及基于复杂知识的因果推断提供量化基础。
01
指标构建
二分网络框架
知识复杂度指标构建的第一步是搭建二分网络(Bipartite Network)框架。二分网络在数学上可以通过邻接矩阵(Adjacency Matrix)描述。对于一个由i个国家、m个技术领域构成的二分网络而言,其邻接矩阵可以表示为:
其中,ci和tj为二分网络的两类节点(对应于邻接矩阵的两个维度),分别为国家节点(c)和技术领域节点(j);矩阵中的元素Mij表示二分网络中两类节点之间的连边,在此处为国家i在技术领域j中专利产出的显示性比较优势指数(Revealed Comparative Advantage index, RCA)。
算法描述
从复杂网络的视角来看,任意国家c或技术领域t的知识“复杂性(Complicacy)”之间相互关联,在数学上可以通过耦合方程(Coupled Equations)描述:
国家和技术领域之间的关系可以通过特定算法描述;例如,当一国参与的技术领域越多、参与某些领域的集中度越高,则该国的知识复杂度越高;而当某个技术领域的参与国数量越少、被某些国家参与的集中度越高,则该领域的知识复杂度也越高。事实上,上述关系可以被囊括与适应度和复杂度算法(Fitness and Complexity Algorithm)之中:
基于该算法求解前述的耦合方程,便可以将国家或技术领域的知识“复杂性”量化为知识“复杂度(Complexity)”。
矩阵分解
指标构建的最后一步便是通过求解耦合方程,从而将前述的二分网络拆解为两个单模网络(1-mode Network):
其中Ncc'和Gtt'分别为国家和技术领域接近度矩阵(Proximity Matrix),前者为由单纯的国家节点构成的单模网络,后者则单纯由技术领域节点构成。二者用于描述国家之间(或技术领域之间)的专利产出相似情况。
通过计算两个单模网络的特征向量中心性(Eigenvector Centrality),便可以得到知识复杂度这一量化指标:
02
国家演化特征
图1. 不同国家的知识复杂度演化特征
注:图(a)至(d)分别展示中国、荷兰、日本以及巴基斯坦对应的演化情况。各图中的“longterm”表示构建二分网络时统计了某一时间点之前所有专利产出总和;“1”、“2”、…则表示只统计该时间点之前的n年间专利产出之和。
基于各个年份不同国家于不同技术领域的专利产出数据,可以构建不同年份的国家-技术领域二分网络,从而分析不同国家知识复杂度随时间的演化特征。图1展示了4个不同国家的演化情况,其中中国和荷兰展示了完全相反的情况——过去二十年中,中国的知识复杂度排名不断上升,荷兰则不断下降(由longterm线可见);因为中国不断有高精尖领域的专利产出,而荷兰大多依赖于上世纪建立起的产业优势(如光刻机),在当下较为前沿的领域(如试听技术)则并无长足进步(由n年线可见)。日本的知识复杂度变化平稳;而巴基斯坦虽然过去一段时间知识复杂度有所提升,但是逐年波动较大,这暗示着其专利产出可能更多地受益于科技进口或是发达国家产业转移,但基于自身产业的科技发展水平事实上仍较为有限。
03
知识产出区位特征
图2. 不同年份的知识复杂度区位特征
注:图(a)至(d)分别展示了1990、2000、2010、2019年的知识复杂度全球状况。图中圆形面积大小代表了知识复杂度的高低;相同的颜色意味着对应的国家被划分为同一社团,即专利产出状况相似。
通过对前述的国家接近度矩阵进行社团结构划分(Community Detection),可以考察知识复杂度在全球范围内的区位特征及其随时间的演化状况。图2展示了过去1990-2019年的区位特征演化情况,其中1990年展示了明显的欧美两大社团;2000年则出现了以新加坡为中心和以日韩为中心的两大亚洲社团;2010年的两大亚洲社团进一步扩大,并表现出了明显的“区位(Location)”;2019年亚洲的专利产出则表现出了明显的异质性——中、日、韩、新、马以及中国台湾地区分属于4个不同的社团,即所谓的“区位”消失了。
供稿:市统计学会
责编:薛依宜