要扭转不科学的教育评价导向,坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾,从根本上解决教育评价指挥棒问题。
如果单纯只是为了改变大学在排行榜的位置而对关键指标进行人工干预,这种没有办学质量提升为依托的排名上升,也只会是昙花一现,并没有可持续性。
一所高校,被“啪”地压成扁平,再修剪掉那些“多余”的边边角角;拿出尺子,测量长、宽,再经过一些并不算复杂的加权计算,得出一个分数。
好,它在众多学校中的位次就这么被决定了。
这个比喻或许有些夸张。但给大学排名,本质上确实是一种“降维”。评价大学,也许需要几千个维度;可在做排名时,只会关注有限的几个维度。北京大学前校长林建华把它比喻为“盲人摸象”:多数大学排名,都是从某一个侧面了解和评价学校。
前段时间,U.S.News(《美国新闻与世界报道》)中国大学数学学科排行榜新鲜出炉。它将曲阜师范大学排到了国内第一,将山东科技大学排到了国内第三。这一结果和公众认知相差甚远,U.S.News排行榜貌似“翻车”了。
不过,无论翻几次车,排行榜还是会继续出。
它现在存在,在可预见的将来,还会继续存在。高校也挣扎过,反对过,但是游戏已经开始,无法停下。
很多大学校长都表达过自己对排行榜的态度——不能不看,也不能全看。
“谈论排行榜的科学性,其实是个伪命题。”南昌师范学院党委委员、副院长刘小强说,任何评估都是在一定价值取向下进行的,无法真正做到全面、准确。“与其纠结评估的科学性,不如拿出对评估科学的态度。别太紧张,别太在乎。评价只是工具。”
四大世界大学排行榜最“悠久”的也仅有10多年历史
要谈高校排行,就绕不开所谓的“四大世界大学排行榜”,分别是U.S.News排名、THE(泰晤士高等教育)排名、QS(Quacquarelli Symonds公司,一家国际高等教育咨询公司)排名和ARWU(世界大学学术排名)。
“四大”的名号,听起来颇有分量。然而,其中历史最为“悠久”的世界大学排行榜ARWU,也只能追溯到2003年。
U.S.News深耕美国,从1983年开始就发布美国国内大学排行榜,它真正开始独立给世界大学排名,则是在2014年。
THE从1992年开始发布针对英国国内的大学排行榜,2004年和国际高等教育咨询机构QS联合推出THE—QS世界大学排名。到了2010年,这两家拆伙,THE换了家合作公司独立发布大学排名。
QS也在拆伙之后,先后与U.S.News、英国太阳报和朝鲜日报等机构合作发布世界大学排名,2014年,QS与U.S.News分开后,独立发布QS世界大学排名。
发源于上海交通大学高等教育研究院的ARWU,算是世界大学排行榜的“元老”。
当年之所以要发布ARWU,是因为上海交通大学想在世界大学中锚定自己的位置。排行榜制定者刘念才和程莹谈过做排行的初衷。他们表示,国家实施“985工程”以来,许多大学都制定了创建世界一流大学的时间表。不过,世界一流大学是什么,谁来检验高校是否建成了世界一流大学?为分析我国大学和世界一流大学的差距,上海交通大学高等教育研究院的研究团队选择了一些国际可比的学术指标,对世界大学进行定量比较。2003年,他们在自己的网站上用英文公布了ARWU。
其影响力用“一石激起千层浪”形容并不为过。欧美国家多家主流媒体对排行榜进行了报道。到2005年3月,上海交大网站访问量就突破了120万人次。有论文曾指出:“ARWU是世界大学排名的先驱, 它引发了其他机构去从事全球性的大学排名活动。”
2009年,上海软科教育信息咨询有限公司成立,全面接管ARWU的发布活动。
为了凸显榜单的科学性,四大排行榜都对外公布了其排名依据的指标及其权重。
有研究者指出,ARWU指标聚焦在科研,重点反映的是大学的学术竞争力;THE的指标维度相对广泛,考虑教学科研的同时,还考虑到知识转化和国际化程度;QS的学术声誉和雇主声誉指标权重占50%,对主观声誉评价相当看重。
“需要注意的是,四大排行榜之所以成为‘四大’,是因为它们影响力大。我也和很多国际国内的学术同行、院校管理者交流过,他们没有谁明确认同过哪家排行榜是更合理的。” 同济大学高等教育研究所副所长张端鸿说,四大排行榜的社会关注度高,但这并不意味着它们就是所谓的“权威榜单”。“有的排行榜发布机构本身就是媒体,自带传播度。当排行榜在国际国内都得到广泛传播,各利益相关方就不得不予以关注。”
当然,这些榜单,也实实在在地跟一些东西挂钩。
比如,学生的出路。
查阅国内多个省份定向境外选调生报名条件后你会发现,它们会对留学生的毕业院校提出排名要求。有些省份明确规定,只有QS排名前100的高校毕业生才有报名资格。成都市新都区2020年特需人才引进公告中,对留学生毕业院校的要求是,进入四大榜全球前100名。
受疫情影响,教育部今年适当增加了部分中外合作办学机构和项目以及内地(祖国大陆)与港澳台地区合作办学机构和项目招生名额,出国留学受阻的学生可以向国内的中外合作大学申请攻读研究生。一些中外合作大学也在招生章程中明确,申请者原录取大学QS排名原则上不得低于150位。
曾经在高等教育界,还有一个未经官方认可、但是又广为传播的说法:在“双一流”建设高校的遴选中,大学如果能排到这四大排行榜任意一个的全球前三百位,则对入选有较大作用。
高校与排行榜关系微妙:“相爱相杀”、互相利用
大学并不是被动地接受排行。
“高校和排行机构也会互相博弈。” 浙江大学中国科教战略研究院副研究员吕旭峰研究了十几年大学排行榜,他告诉科技日报记者,除U.S.News以外,其他三大排行榜都和全球高校保持了较为紧密的联系,部分学校也会向排行机构提出指标体系的调整建议。
排行机构愿意摆出聆听高校声音的姿态,也是因为——高校本身就是它们的潜在客户。
榜单发布者通过给大学排名的方式,在全球获得了商业显示度,也因此拥有了对大学开展商业公关的能力。他们可以向大学推销自己的数据产品、认证产品和咨询产品。“这些产品的收费也都不低。”张端鸿说。
数据库和专业分析师是排行机构所拥有的独特资源。“它可以为高校提供定制化服务。比如你想分析哪些学科,和哪些高校进行横向对比,他们都能做出来。”吕旭峰表示。
此外,活跃的排行机构都会定期举行高端全球性的学术论坛,请来专家学者和名校校长发表观点。通过这种方式,它们也能再刷一波存在感。
大学对排行榜的态度,其实也比较微妙。
厦门大学教育研究院教授别敦荣曾撰文指出,大学对排名结果表现出选择性接受的特点。对自身有利的,就欢迎,并在官网上和相关材料中予以刊载;对自身不太有利的,就不予理会或者予以批判。
吕旭峰对排行榜的研究来源于学术兴趣,他就是想知道,“他们究竟是怎么玩的”。对排行榜的指标条分缕析,就能明白这些排行究竟是怎么一回事。“我们学校会看排行榜,但不会唯它是从。”吕旭峰说,对排行榜的态度,也展现了一所大学对自己发展道路的自信程度。
但个别高校就不仅仅是“看看”了,他们还想为排名再做些什么。
毕竟,排行榜位序的提升,可能直接影响到高校招生、教师聘用、政府资源分配和社会合作办学。它是看得见、摸得着的大学建设成果。
张端鸿介绍,高校可以向排行机构购买咨询服务,后者会提供一些排名提升的策略技巧。毕竟,排行机构知道,哪些少数关键指标对决定大学位次有显著作用。
比如,U.S.News的指标中,65%为数据库客观数据,指标设计更关注数量,如论文数、著作数和被引数等;THE的指标中,有三分之一为主观调查数据,28.5%为学校报送数据,数据库客观数据占了不到四成;QS指标体系中,50%为主观调查数据,同行评议和雇主评议占比较高;ARWU则百分之百使用客观数据,而且其中一项是学校培养出的诺贝尔奖和菲尔兹奖获奖者人数,明显偏重理工领域。
张端鸿介绍,如果论文被引用数重要,有的高校可以通过组织化方式,比如鼓励甚至要求教师之间互引,来人为提升引用数;如果高被引科学家人数重要,那高校也可以用“挖角”的方式,来产生自己的高被引科学家。“科学家在哪工作,这一选择本质上应该植根于其研究的内在需求。如果用提高定价的方式诱使科学家流动,功利气息太浓,这并不符合学术逻辑。”
刘小强对高校学科建设研究颇多。他知道,一些学校为了增加学科产出成果,费尽心思挖来大牛及团队。“我开玩笑说过,一旦哪天这位大牛离开了,学校的学科建设就归零了。”
不过,如果哪所高校的排名出现了不正常跃升,圈内人是能看出来的。“都知道是怎么一回事。”吕旭峰说。
当然,对排行榜,高校也不用完全不闻不问。毕竟,排行榜是一种信息披露。林建华说过,大学排名的确为高校提供了很多大学发展状态的信息,如使用得当,可以帮助高校发现问题。
如果学校的单项指标存在不足,可以分析它背后的原因是什么。要是国际声誉分值不够,那是不是意味着学校的学者国际交流不够多;要是学术成果发表数量不足,那是不是显示学校的人才梯队存在结构性的问题……张端鸿说,找到问题的症结,对症下药,慢慢“调养”,这样的诊断性分析才是有价值的。如果单纯只是为了改变大学在排行榜的位置而对关键指标进行人工干预,这种没有办学质量提升为依托的排名上升,也只会是昙花一现,并没有可持续性。
排行榜会继续存在,但随着了解程度的加深,人们对其在意程度也会降低
一个广为流传的段子是,中国排名第一的高校,有两所;排名前三的高校,有五所,排名前五的高校,有十所。
“从科学角度来说,大学不能被排名,这是一种共识。”张端鸿说,常见的比喻是,大学就像不同的水果,有的大学是香蕉,有的是柑橘,有的是苹果,硬要把它们放在一起,比比哪个更好吃,怎么比都不太有说服力。
但大家也都想知道,我国高校在世界上究竟身处什么位置。
吕旭峰告诉科技日报记者,党的十八大以来,中国高等教育的确发展很快,无论是在人才培养、科学研究、社会服务、文化创新与传承还是中外合作与交流上,都有长足进步。“中国高等教育这几年的发展速度已经超过了欧美国家。这在国际上都得到了公认。”吕旭峰说。
但是,教育界一直想要建成的世界一流大学到底长什么样呢?
吕旭峰表现得很淡然:“大学做好自己的工作,履行好自己的使命就好了。我们和欧美国家的体系不一样,大家对一流大学的认知不一样,你能建成中国一流大学、一流学科,就很好了。”
他认为,对大学可以有三个评价维度:高校对人类文明、全球科技发展作了什么贡献?对满足国家重大需求作了什么贡献?对推动区域经济发展作了什么贡献?
这三个维度,对应的也是不同类型、不同层次的学校。“大学需要分类分层评价。”吕旭峰强调。
但这些指标的复杂度,已经超过了排行榜尤其是全球性高校排行榜的承载范围。
其实,理想中的高校评估,应该由第三方机构来进行。“它应该具有专业性和独立性,是非营利组织,跟大学之间不存在利益关系。”张端鸿说,排行榜的研发人员,必须足够了解高等教育;指标体系的设计,也应该经过充分的专业认定。
“排行榜会继续存在,但随着大家对排行榜了解程度的加深,政府、大学和社会对它的在意程度也会降低。”张端鸿表示。
刘小强讲起了古德哈特定律——当决策者试图以一个事物的客观测度指标作为指针来施行政策时,这一指标就再也不能有效测度事物了。
习近平总书记曾在全国教育大会上强调,要扭转不科学的教育评价导向,坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾,从根本上解决教育评价指挥棒问题。
其实,很多排行榜的评价指标,恰恰就是“论文”“帽子”这些能摆在明面上的数据。办学理念、办学模式、发展战略、大学文化这些被视作大学灵魂与个性的因素,因为难以量化,又无法成为排名依据。
“评价大学是世界性难题,我们能做的,就是放下紧张的心态,不要把排名当成我们唯一奋斗的目标,只把评估结果看成检验我们办学水平的参考就够了。”刘小强说,当评估结果、排名和政府拨款、资源分配、“双一流”建设脱钩,当它仅仅成为一个参考,也就不必去纠结它是否百分百科学、准确了。“高校不再铆足了劲去应对评估和排名,此时的评估和排名反而可以接近准确。”刘小强强调,关键是要让评价回归评价本位,回归工具本身。
工具就是工具,它不应也没必要变成目的。