主页

中国哪里的玉最假

  主成分分析与因子分析在评价前均必须进行KMO检验和Bartlett检验,而且两者的检验结果相同。经检验,KMO值为0.839,远远大于0.5的底线水平;Bartlett检验值为7 933.244,相伴概率为0.000,通过了统计检验,所以从KMO检验和Bartlett检验角度,JCR 2015经济学期刊评价可以采用主成分分析或因子分析。

  主成分分析不需要评价指标服从正态分布,因子分析需要评价指标服从正态分布。从正态分布检验结果看,全部11个指标均不服从正态分布,如表2所示。Price(1965)[26]最早发现引文网络的入度和出度均服从幂律分布特征,并指出幂指数介于2.5~3.0之间。Redner(1998)[27]也发现了引文网络的幂律分布规律,并指出出度幂指数为3.0。Seglen(1992)[28]发现引文指标数据呈典型的偏态分布,并不服从正态分布。由于JCR 2015数据库中,经济学期刊数量位居前三,对于期刊数量较少的学科而言,服从正态分布的机率更小。所以从数据分布看,JCR2015经济学期刊评价并不适合采用因子分析。

  采用主成分分析进行评价共提取特征根大于1的两个主成分,如表3所示,第一主成分方差贡献率为58.39%,第二主成分的方差贡献率为15.93%,累计方差贡献率为74.32%,信息损失为25.68%,应该说,这个比例还是比较高的,用主成分分析进行评价要慎重。

  因子分析的信息损失包括两部分,一是提取公共因子造成的信息损失;二是原始指标的特殊因子信息损失。因子分析同样提取特征根大于1的两个公共因子,如表4所示,第一公共因子的方差贡献率为56.96%,第二公共因子的方差贡献率为17.37%,累计方差贡献率为74.32%,因子分析第一部分的信息损失为25.68%,和主成分分析的信息损失一致。

  因子分析评价的第二个信息损失是每个原始指标提取公共因子后的特殊因子信息,如表5所示,每个指标的信息损失可以用1减去共同度表示,不同指标的信息损失程度是不一样的,影响因子、他引影响因子的信息损失要小一些,只有9%左右,但是即年指标的信息损失很大,为58%。

  主成分载荷矩阵如表6所示。第一主成分载荷较大的指标包括总被引频次、影响因子、他引影响因子、5年影响因子、特征因子、论文影响分值、标准特征因子、影响因子百分位,代表了期刊影响力指标;第二主成分载荷较大的指标包括即年指标、被引半衰期、引用半衰期,代表了期刊时效性指标。第一主成分涉及8个指标,第二主成分涉及3个指标,总体上主成分分析的代表性较好。

  因子旋转矩阵如表7所示,其结果与主成分分析类似,虽然从理论上讲,因子分析的解释能力要大于主成分分析,但本例中,两者均具有较好的解释力。 从公共因子涉及指标数量看,第一公共因子同样涉及8个指标,第二公共因子涉及3个指标,代表性也较好。

  首先将主成分分析的评价结果作为因变量,两个主成分作为自变量进行岭回归,然后将因子分析的评价结果作为因变量,两个公共因子作为自变量进行岭回归,结果如表8所示。

  从岭回归结果看,无论是主成分分析还是因子分析,所有的回归系数均为正数,回归拟合优度R2均较高,所以单调性检验结果良好。

  由于主成分分析与因子分析两种评价方法中,第一主成分与第一公共因子的含义一致,第二主成分与第二公共因子的含义也一致,主成分分析中,第一主成分方差贡献率大于第二主成分的方差贡献率,因子分析中,第一公共因子的方差�献率也大于第二公共因子的方差贡献率,因此无法从主成分或公共因子方差贡献率(权重)角度比较两种方法。

  但是可以从模拟权重角度进行主成分分析与因子分析的比较,单调性检验中采用岭回归得到的回归系数,本质上就说明了不同指标的重要性,将其标准化处理后就是权重。将主成分或公共因子涉及的指标权重相加,就得到了各个主成分或公共因子的模拟权重,然后就可以进行对比分析。

  从主成分分析与因子分析模拟权重的比较看,主成分分析期刊影响力指标的模拟权重为0.697,时效性指标的模拟权重为0.307;因子分析期刊影响力指标的模拟权重0.805,时效性指标的权重为0.195。考虑到在经济学期刊评价中,影响力毕竟是比较重要的,因此采用因子分析更为合理,当然,也可以根据评价目的来进行选择。

  根据实证研究的全部检验过程,结果总结如表10所示。主成分分析评价通过了KMO检验和Bartlett检验,不需要评价指标服从正态分布,主成分的含义清晰,指标单调性检验较好,但是信息损失高达25.68%,权重合理性也一般,因此并不适合采用该方法对经济学期刊进行评价。因子分析通过了KMO检验和Bartlett检验,公共因子含义清晰,指标单调性较好,但是评价指标均不服从正态分布,除了公共因子信息损失较大外,每个指标中也存在特殊因子损失,因此不适合采用该方法对经济学期刊进行评价。

  本文建立了主成分分析与因子分析评价方法适用性的检验框架与检验体系,从评价前检验、评价中检验、评价后检验3个角度进行检验。评价前检验包括KMO检验与Bartlett检验,对于因子分析,还需要进行评价指标的正态分布检验,如果有数个指标不服从正态分布,就不能选用因子分析。评价中检验主要是信息损失检验,由于指标信息损失对评价结果影响较大,要求累计方差贡献率不宜低于85%;对于因子分析,由于还存在指标特殊因子信息损失,累计方差贡献率应该更高一些。评价后检验主要包括主成分或公共因子的解释力检验、涉及指标数量检验(不宜低于2个)、指标单调性检验和权重合理性检验。

  由于因子分析的信息损失往往较大,既包括遗弃特征根小于1的公共因子信息损失,还包括遗弃指标特殊因子的信息损失,因此在检验中,如果累计方差贡献率低于90%就要慎重选用。在实际评价中,累计方法贡献率达到90%的情况并不多。此外,因子分析还需要评价指标服从正态分布,这也是一个比较重要的硬性条件,至少在学术期刊评价中,评价指标服从正态分布的情况比较罕见,所以在科技评价中因子分析要慎重选用。

  由于主成分分析也存在信息损失,这在评价对象较多,区分度较低的情况下,信息损失会严重影响评价结果的排序,会导致评价方法选取不当而产生的不公平。当评价对象较少时,即使存在信息损失,但是由于区分度较大,对评价结果排序的影响也不大,所以主成分分析适合较少评价对象的科技评价。

  [1]谭开明,魏世红.基于主成分分析的西部地区创新能力评价研究[J].西安财经学院学报,2013,(1):73-77.

  [2]杨武,解时宇,宋盼.基于主成分分析的中国科技创新景气指数研究[J].中国科技论坛,2014,(12):18-22.

  [3]史晓燕,张优智.基于主成分分析法的科技进步测评实证研究[J].科技进步与对策,2009,(22):147-151.

  [4]徐顽强,孙正翠,周丽娟.基于主成分分析法的科技服务业集聚化发展影响因子研究[J].科技进步与对策,2016,(1):59-63.

  [5]李敬锁,赵芝俊.国家科技支撑计划农业领域项目绩效的影响因素分析[J].科技管理研究,2015,(20):28-31.

  [6]吴岩.基于主成分分析法的科技型中小企业技术创新能力的影响因素研究[J].科技管理研究,2013,(14):108-112.

  [7]韩晓明,王金国,石照耀.基于主成分分析和熵值法的高校科技创新能力评价[J].河海大学学报:哲学社会科学版,2015,(2):83-88.

  [8]辛督强.基于主成分分析的13种力学类中文期刊综合评价[J]。 中国科技期刊研究,2012,(2):224-227.

  [9]何先刚,马跃,鲜思东.基于主成分分析的网络电子期刊模糊综合评价[J].重庆邮电大学学报:自然科学版,2014,(6):861-865.

  [10]顾雪松,迟国泰,程鹤.基于聚类一因子分析的科技评价指标体系构建[J].科学学研究,2010,(4):508-516.

  [11]李子伦.产业结构升级含义及指数构建研究――基于因子分析法的国际比较[J]当代经济科学,2014,(1):89-98. [12]董晔璐.基于因子分析的我国高校科技创新能力评价[J].科学管理研究,2015,(6):32-34.

  [13]黄斌,汪长柳,马丽.基于因子分析的江苏省科技服务业竞争力综合评价[J].科技管理研究,2013,(22):59-62.

  [14]翁媛媛,高汝熹.科技创新环境的评价指标体系研究――基于上海市创新环境的因子分析[J].中国科技论坛,2009,(2):31-35.

  [15]郑丽霞.因子分析在SCI期刊综合评价中的应用[J].农业图书情报学刊,2016,(7):53-56.

  [16]柴玉婷,温学兵.师范大学理科学报学术影响力评价研究[J].渤海大学学报:自然科学版,2016,(1):24-29,34.

  [17]何莉,董梅生,丁吉海,等.安徽省高校自然科学学报学术影响力综合评价分析――基于因子分析法[J].中国科技期刊研究,2014,(3):427-431.

  [19]俞立平,潘云涛,武夷山.学术期刊评价中主成分分析法应用悖论研究[J].情报理论与实践,2009,(9):84-87.

  [20]楼文高,吴雷鸣.科技期刊质量综合评价的主成分分析法及其改进[J].统计教育,2010,(5):57-62.

  [23]傅德印.因子分析�y计检验体系的探讨[J].统计研究,2007,(6):86-90.

  [24]俞立平,刘爱军.主成分分析与因子分析在期刊评价中的改进研究[J].情报杂志,2014,(12):94-98.