日前出台的《“双一流”建设成效评价办法(试行)》,明确提出评价的三大维度是大学及学科的整体发展水平、成长提升程度及可持续发展能力。整体发展水平的评价相对容易理解和开展;可持续发展能力主要涉及发展的条件支撑,评价可行性也很高。而成长提升程度的评价体现的是增值理念,考查的是增量变化及发展质量,属于增值评价范畴。虽然这种理念是先进的,并直指“双一流”建设的本质——大学及学科的发展进步,具有明显的公平性以及直指建设周期的精准性,然而增值评价也面临不少挑战。
首先,增值评价对不同内容的适用性存在较大差异。人才培养、科学研究、社会服务、教师队伍建设这四项评价内容当中,更适合在建设周期内开展增值评价的是科学研究。而人才培养的成长提升程度很难在五年建设周期中开展评价。某一建设周期的人才培养成果可能是几个建设周期前的贡献。在教师队伍建设、社会服务等评价内容中提取出公认有效的增值指标也存在一定困难。即便是科学研究成效的增值评价,也只适合更有表现度的量化指标,如高被引论文数量的变化、国家级课题数量以及奖项的变化等。而科研成果的创新质量和贡献很难用具体的增值衡量。总之,只有容易量化的成长提升指标才更适用增值评价。如果定性描述成长提升程度,则无法在大学间进行客观比较。
其次,增值评价本身在技术和操作上存在一些缺陷。一方面,学科的成长提升程度极其依赖学科建设的历史积淀。一些本就位于世界一流或国内一流的学科,其成长提升存在较大困难,即存在所谓“天花板效应”。而一些具有特色且颇具实力的二级学科,由于学校支持的原因,无论怎么发展也无法超过本身就大而全的一级学科。学科建设是存在地位固化效应的——只有极少数发展较突出的学科才具有显示度。另一方面,成长提升程度的评价需要有合适的基准参照点。建设周期内的评价是自己和过去比算增值,还是和过去兄弟单位的平均水平比算增值?不同基准参照点得出的评价结论一定大不相同。总之,如果没有相对统一的标准,参评单位自然会拿出对自身有利的增值指标。这就很容易陷入美国学者斯坦福·彼尔姆所说的“伪评估”困境。
最后,强调建设周期内的增值可能会引发短期行为。大学和学科的发展需要长时间积淀,培养一流人才更要久久为功。在“加快建设”的政策语境下,追求五年建设周期内具有显示度的增值指标便成为参评单位及学科的必然选择,比如师资队伍、国际合作办学项目等在数量上的快速增加。这些增值指标在多大程度上服务于高质量的教育以及人才培养,反倒可能被忽视。此外,学科发展是存在生命周期现象的,快一点儿、慢一点儿都是正常的。关键指标不可能在所有建设周期里都会产生增值。过于强调建设周期内的成长提升,有可能让建设手段异化为建设目标。
当然,增值评价面临的问题绝不止上述三种。根据笔者的体会,核心在于增值指标的选取及测量问题。虽然评价办法以及相关政策阐释已经明确了若干注意事项,为增值评价创造了条件,但即便是好的评价理念,如果运用不当,也会产生意想不到的副作用。 “双一流”建设具有极端重要性和敏感性,有必要充分认识这些挑战。笔者建议在开展增值评价时注意以下几点:
一是构建相对统一且具有共识的成长提升评价指标。目前,“双一流”建设的目标任务均为建设高校自主提出,但在前期评价办法尚未出台时,这些目标任务很少以增值指标展示。因此,建议组织不同学科专家就学科成长提升的评价指标开展研究。至少在学科或学科群的层次上,构建相对统一且各方公认的增值评价指标体系,并针对现有建设水平层次不同的高校,允许其增值评价指标体系具有一定开放性(即指标库),高水平大学与其他水平大学应该具有不同指标。唯此,才能在相对客观、可供比较的基础上开展增值评价。
二是建设供学校以及评价专家使用的监测数据体系。成长评估至少需要建设起点和结束两个时点的数据资料。因此,有必要建设常态化监测数据体系。该体系应该让所有参评学校和评价专家都能在需要的时候申请使用。尤其是一流学科建设的评价,更需要可比的监测数据体系。
三是注重成长提升指标的建设内涵解读。一个建设周期内,不同成长提升指标的内涵可能不同,比如科学研究中实现了“从0到1”的创新,体现的更多是“增质”而非“增量”;而师资队伍建设在高层次人才上实现“从0到1”的突破,则与人才项目申请的周期、突然加大的引进力度等诸多偶然因素有关。虽然都是增值,但发生和“建设”的逻辑截然不同,有必要进行解读。
总之,增值评价用于“双一流”建设成效评价存在挑战,需要相关部门在深入研究的基础上,做更加细致的设计,在不断向前的建设进程中让成长提升的增值理念深入人心,以服务于建设目标的实现。
(作者系华中科技大学教育科学研究院副教授)
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。