廖 敏
一、大数据时代传统院校决策模式面临的挑战
1.院校决策的传统模式
诺贝尔经济学奖获得者、美国卡内基·梅隆大学赫伯特·西蒙教授认为:“决策是管理的心脏,管理是由一系列决策组成的,管理就是决策”。每一项决策都包含着目标的选择和有关目标的行动;而那个目标,又可能是另一个与此区别很大的目标的中介; 如此递推下去,直至达到一个相对的最终目的为止。从院校发展的视角来看,院校决策是促使一系列大学组织行为达成院校发展目标的过程。几乎所有的大学在每周的会议表上都会罗列出各种各样的会议日程安排,这些会议安排所讨论的内容最终的拍板通常是由拥有决策权的人或者最高决策层来完成的,这种院校决策的传统模式有其存在的合理性, 但也存在明显的不足:由于过分强调院校决策的常规流程,即过去是怎么决策的,现在也按照同样的常规和程序进行决策,忽视了院校决策环境的变化,既包括外部环境时代以及国内外高等教育自身的发展变化等,也包括内部环境,如院校管理模式、院校竞争要素的调整以及对影响院校决策的有关数据的重视程度等。因此,传统的院校决策模式在决策过程中忽视院校发展的内外部环境的实际情况,通常由拥有决策权的人以己有限的理解、假想、推测来取代全面的调查、论证和科学的判断,最终有可能使院校决策与大学真正需要实现的目标发生偏离甚至导致院校发展上的失误,这对处于激烈的高校竞争环境中的院校而言,既不明智,也是危险的。
2.大数据时代大学排名对院校决策的影响
大学在自身运行的过程中产生了各种各样的院校发展数据,这些数据有些得到了重视和运用,尤其是大学排名机构,但更多地则是被视为院校发展统计意义上的数据。这主要是由于传统的院校发展数据规模相对较小、数据类型单一,处理数据的工具相对简单。因此,尽管这些数据作为院校发展的事实,但在院校决策中的价值尚未得到充分的重视和体现。
随着大学排行榜数量的增加和不断流行,一定程度上影响了高等院校的决策和战略规划过程。许多大学在确定战略发展方向时都直接或间接地受到大学排名的影响,一些大学则明确地将提高排名作为学校的战略目标,并将资源分配、人事聘用和其他决策与该目标联系起来,排名也成为一些高校高层会议的重要议题。
当大学成了真正的“大”学,规模扩大的同时也带来了大学运行发展数据的变化。和以往的情形相比,院校发展数据规模扩大、数据类型繁多,处理数据的工具也更加多样化。有研究者对传统的数据库和大数据进行了比较,并形象地把前者类比为“池塘捕鱼”,后者为“大海捕鱼”。“鱼”是待处理的数据,“捕鱼”环境条件的变化导致了“捕鱼”方式的根本性差异。云计算、物联网、社交网络等新兴服务促使人类社会的数据种类和规模正以前所未有的速度增长,大数据时代的到来,数据从简单的处理对象开始转变为一种基础性资源,如何更好地管理和利用数据已经成为普遍关注的话题。
二、大学排名:从院校发展数据到院校决策依据
1.大学排名:作为数据
作为“数据”的大学排名,对院校发展的价值在于提供了两个方面的“参考”。一方面,为与院校发展有关的受众群体提供了院校发展情况的参考。在过去互联网并不发达的时候,许多学生和家长及其填报高考志愿和选择考研学校和专业的时候, 更多地是通过老师、亲戚朋友等。尽管这种途径获得的信息十分有限, 但由于当时的大学数量和规模都相对较小,也仍然能够起到一定的作用。时至今日,在高等教育国际化和大众化的推动下,大学自身运行产生的数据量以远远超过以往,准确地找到最需要的数据并从这些数据中获得关于填报高考志愿、考研择校以及毕业就业等方面的信息,是许多学生、家长以及毕业生最关心的。加上许多高校信息公开的程度极为有限,大学排名所提供的各种数据日益成为他们了解和把握自身择校和就业等需求的重要参考依据。2004年,南开大学对天津市10所重点中学的“高考考生及家长填报高考志愿” 的问卷调查显示,85.3%的考生和85.7%的家长关注“介绍大学和专业情况的信息”,59.9%的考生和64.6%的家长关注“社会上兴起的大学排名现象”。
另一方面,大学排名也成为院校发展获取经济、社会和文化资本的参考。大学排名的层化作用对社会中教育资源和教育资本流向、流量产生影响,排名的变化牵连着各个大学维持和获取不同资本能力的强弱:(1)成为获取院校发展经济资本的参考。政府作为院校发展经费的主要筹措渠道,对不同院校的财政拨款与对大学的评价密不可分。大学排名从一个视角为不同院校的发展状况提供了一个综合的、主题性的评价结论。来自民间社会团体的捐赠和资助也同样受到大学排名的影响,尤其是在科学研究、人才培养、服务社会方面有着突出贡献和成就的高校。一些大学排名还专门对不同院校的声誉进行了排名,排名靠前的院校获得社会捐赠的机会显然大于排名一般的院校。(2)成为获取院校发展社会资本的参考。大学排名加剧了院校社会资本获得的“马太效应”,排名靠前的学校更容易获得数量可观和质量上乘的社会资本,而名次下降的大学其社会资本的“可持续”积累能力会有所下降,名不见经传的大学在竞争激烈的教育场域的资源争夺中,要开拓自己的社会、学术关系网络将变得更加艰难。(3)成为获取院校发展文化资本的参考。大学的各种学术成果、所取得的各种认证资格、在某一学科领域的学术话语权等,都属于院校发展文化资本的客观形态,处于排名前列的这些方面不仅是对院校发展文化资本能量的认可,也将影响到毕业生的就业质量和就业率。用人单位往往也以此对该校毕业生的能力和潜质作出基本的判断。大学拥有的文化资本能量越强,获得来自用人单位、社会的评价和认可度往往也就越高。
2.大学排名:作为依据
随着大学排名的不断完善以及院校发展中对第三方评价的需求的增加,“排名”一词已经逐渐被等同于高等教育绩效测评。这意味着,大学排名的身份和角色正在从过去单一的院校发展数据向院校决策依据转变。
欧洲大学协会(EUA)的“排名对院校战略与发展进程的影响”(RISP)项目印证了大学排名从数据到依据作用的转变。作为全球第一个对高校如何使用排名以及排名对其产生的冲击和影响进行研究的泛欧调查,这项调查的结果表明,尽管许多人热衷于质疑排名和排名方法的缺陷以及它们将诸如绩效、教育和研究质量等复杂问题以简单化的方式呈现。但是,几乎所有院校都在关注着排名。正因如此,很多院校经常不明确排名应当如何使用,以及排名对外部利益相关者有多大的影响。事实上,很多高等教育机构已经开始将排名所提供的信息用于多种目的,包括:填补信息差距、进行标杆管理、制定院校决策、用以宣传营销。排名对院校发展进程的影响包括:跟踪排名的机制,明确院校现状并改善核心活动, 收集院校信息,投资并改善学校形象。RISP项目有来自39个国家的171所高等教育机构参与了的调查,调查分析和研究的结果显示,在排名对院校决策的影响方面,被调查对象中有39%已将排名的结果用于学校战略制定、组织管理或学术行为中,有三分之一的被调查者计划这样做,仅有29%的认为排名并没有以这种方式被使用过。当一些决策事项被列出时,69%的被调查者认为, 其中至少有一个是受到排名影响的,这比39%的被调查者认为排名会影响到决策的比例明显要高。在12项排名“对院校在下列决策中有何种影响”的调查中,被纳入国内排名或改善院校在国内排名的位置对院校行为有显著的影响。这些被调查的院校比其他所有被调查者更倾向于采取更多的决策。在109所国内排名的院校中,因排名而进行的院校决策中:“修订政策”一项所占比例最高为33%,其次是“正式机制不变,但是会对一些具体环节给予新的重视”和“有限考虑一些研究领域”,这两项占了28%。
三、大数据思维变革对大学排名在院校决策中的影响和启示
正如维克托·迈尔-舍恩伯格和肯尼思·库克耶在《大数据时代》一书的引言中所说的那样:大数据开启了一次重大的时代转向。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发。
思维变革是大数据时代的重要变革之一。大数据概念最初是指需要处理的信息量过大,已经超出了一般电脑在处理数据时所能使用的内存量,因此工程师们必须改进处理数据的工具。信息总量的变化导致了信息形态的变化——量变引发了质变。过去,一旦完成了搜集数据之后,数据就会被认为没有用处了。现在,人们不再认为数据是静止和陈旧的。大数据时代就是让数据“发声”,即发现和理解信息内容及信息与信息之间的关系,它的精髓在于分析信息时思维的三个重大的转变,这三个转变是相互联系和相互作用的:首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本;其次,要乐于接受数据的纷繁复杂,而不再追求精确性;最后,思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。大数据时代发生的这三个思维变革对大学排名在院校决策中影响是什么?这些影响带给我们怎样的启示?笔者认为,主要有以下三个方面:
1.关注大学排名与院校发展的全体数据而不是随机样本
大数据思维变革特征之一为“更多”。其表现为:当数据处理技术已经发生了翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马一样。一切都改变了,我们需要的是所有的数据,“样本=总体”。这一思维变革的主要内涵在于:要利用所有的数据而不是仅仅依靠一小部分数据。小数据时代的随机采样是通过最少的数据获得最多的信息,随机采样取得了巨大的成功,成为现代社会、现代测量领域的主心骨。但这只是一条捷径,是在不可收集和分析全部数据的情况下的选择,它本身存在许多固有的缺陷,即采样忽视了细节考察。统计抽样只是为了在技术受限的特定时期,解决当时存在的一些特定问题而产生的,其历史尚不足一百年。如今,技术环境已经有了很大的改善。在某些特定的情况下依然可以使用样本分析法,但这不再是分析数据的主要方式。
院校决策离不开大学排名所呈现的关于院校发展的各种数据,过去很多院校常常关注的主要是总排名或者类似于某某100 强的数据,或者关注某一排行榜中关于院校发展某一方面的“利好”数据。从国内四个主要的大学排名来看,同一所院校在同一年度不同排名机构的总排名和单项排名中很少有完全一致的,甚至有的院校排名在两个不同排名体系中的同项排名结果存在相当大的差距。还有,过分关注了大学排名体现数据结果整合最集中的总排名忽视了其他单项排名中院校发展情况可能存在的优势和劣势。比如,有的地方院校与985、211 大学相比,在总体实力上尽管存在明显差距,但由于在某个学科建设方面的长期投入形成了自己的特色和优势,这样的院校在全国排名中没有入围100强,但在学科排名中却往往异军突起。这些情况说明,在进行院校决策时,要尽可能充分关注大学排名与院校发展有关的全体数据,这就意味着要去了解、搜集和分析不同的排行榜中对某一院校排名的所有数据,从全国排名到学科排名以及专业排名等等。只要是涉及院校发展排名的相关数据,包括对同一年度涉及院校发展的所有排名的全体数据都需要进行整合,或者设置一个数据观测时段,近五年或近十年的排名数据,取一个院校发展比较范围,省属高校或者理工类高校等等,对全体数据整合之后进行一个综合的分析和评价。
2.接受大学排名与院校发展的混沌性而不是精确性
大数据思维变革特征之二为“更杂”。这一变革认为,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界窗户。这一思维变革的主要内涵包括:允许不精确;大数据的简单算法比小数据的复杂算法更有效;纷繁的数据越多越好;混杂性不是竭力避免,而是标准途径。对“小数据”而言,最基本、最重要的要求就是减少错误,保证质量。因为收集的信息量比较少,所以我们必须确保记录下来的数据尽量精确,在采样的时候,对精确度的要求就更高更苛刻了。对精确度的高要求始于13世纪中期的欧洲,这种通过测量现实而理解现象的方法逐渐被运用到科学观察、解释方法中,体现为一种进行量化研究、记录,并呈现可重复结果的能力。20世纪20年代,量子力学的发现击破了“测量臻于至善”的幻梦,在不断涌现的新情况里,允许不精确的出现已经成为一个新的亮点而非缺点。因为放松了容错的标准,人们掌握的数据也多了起来,还可以利用这些数据做更多新的事情。这样就不是大量数据优于少量数据那么简单了,而是大量数据创造了更好的结果。大数据时代要求重新审视精确性的优劣,如果掌握了大量新型数据时,精确性就不那么重要了。同样可以掌握实情的发展趋势。大数据不仅不再期待精确性,也无法实现精确性。大数据要求人们有所改变,必须能够接受混乱和不确定性。
大学排名连年发布的各项数据从实质上来说已经成为反映院校发展的重要“大数据”,连同产生这些数据的排名指标及其设计都透露出时代变革中对大学发展的诉求。然而,以往在院校决策在运用大学排名的数据方面,主要分析和关注排名的精确结果,忽视了排名的复杂性以及作为全体数据在院校决策中的价值。排名的复杂性在于,不同的机构对于评价一所院校的视角往往是不同的,再加上数据搜集、处理和分析方式上的差异以及评价指标体系设计的差别,对同一年度的同一所大学会得出完全不同的两种排名数据。对于排名机构来说,力求排名结果的精确性、合理性、公正性无可厚非,但对于院校自身来说,既然排名结果已经身不由己, 那就应当去关注值得关注的,忽略有些意义不大的数据,比如在某一排行榜,北大今年第一,清华第二,明年的情形则是清华第一,北大第二,北大和清华因此会损失了什么吗?或者这种差别所反映的办学质量是不是真的值得去攀比?并且从院校发展的实质来说,一所大学一年之内的全国排名上升10-20名左右的意义是否有着至关重要的意义?以“全国排名”的情况来看,同一所院校在同一年度不同排行榜的名次相差值有的超过了20个名次,这是一方面。另一方面,即使是入围了全国百强榜单,也还要看在后续的几年里是否能够继续保持,如果不能,以此为依据的院校决策就有可能在新的一年或下一年失效乃至于失信。再放到不同排名体系选取的几百所乃至上千所高校的范围来看,与其执着于究竟能排在第几名的精确性,不如从排名的变化中归纳和分析发展趋势,对于院校决策更能提供有价值的参考。接受大学排名的混沌性意味着首先要转变过去注重排名精确结果的思维方式;其次要对不同大学排名的数据来源、搜集及处理方式,以及对评价指标体系等有关内容进行全方位的分析和比较,还应当透过数据和指标体系的变化,把握大学发展的新动向、帮助院校进行办学角色定位包括预测大学排名。
3.注重大学排名与院校发展的相关关系而不是因果关系
大数据思维变革特征之三为“更好”。这一变革认为,知道“是什么”就够了,没必要知道“为什么”。在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”。这一思维变革的主要内涵包括:关联物成为预测的关键;强调“是什么”而不是“为什么”;改变从操作方式开始。侧重于大学排名与院校发展的相关关系或因果关系会带来什么样的不同?通过因果关系了解世界时,指的是在理解和解释世界各种现象时使用两种基本方法:一种是通过快速、虚幻的因果关系;还有一种就是通过缓慢、有条不紊的因果关系。大数据以“相关关系” 为核心改变了这两种基本方法在我们认识世界时所扮演的角色。相关关系的核心是量化两个数值之间的数理关系,相关关系强意味着当一个数据值增加时,另一个数据值很有可能也会随之增加,反之亦然。因此,通过找到各种现象的良好的关联物,相关关系可以帮助我们捕捉现在和预测未来,而建立在相关关系分析法基础上的预测就是大数据的核心。通过探求“是什么”而不是“为什么”,相关关系帮助我们更好地了解世界。其价值在于:不仅仅提供了新的视角, 而且提供的视角都很清晰。在改变操作方式方面,也不再把精确性视为重心,要接受混乱和错误的存在。
大学排名作为院校决策的依据主要在于两个方面: 一个是进行院校发展的事实判断;另一个进行院校发展的价值选择,价值选择往往就是一种预测,对今后一段时间内,关于一所大学的发展何为何不为做出预测和选择。要实现大学排名除了作为事实判断还能对院校发展进行预测的功能,则须分析大学排名与院校发展的关联性,更具体的指向就是大学排名中哪些指标和数据作为重要因素在影响着排名全体数据的走向,以及这些走向与院校发展的关联程度。通过这些走向和关联程度去看其中的共性和差距,根据数据和指标所透露出的决策信息的运用和管理,进一步明确大学发展的责任和自由。可以说,大数据思维变革带来的最重要的影响是使大学可以在很大程度上从对排名因果关系的追求中解脱出来,转而把注意力放在排名指标和数据与院校发展相关关系的发现和使用上,为提升院校发展的核心竞争力提供重要的决策依据。
四、寻找排名数据背后的机构中“人”的温度和创新的力量
大学排名的数据来源于大学排名机构对院校运行过程中产生的各种数据的选择和整合。事实上,更大的数据源于“人”本身。
通过大学排名的数据可以为我们打造一个相对稳固、高效的院校发展识别格局。与此同时,也否定了大学之所以是大学的重要组成部分——大学的自由和大学的责任。当大学排名数据成为择校考生、政府和大学集体选择的工具,一切围着排名数据转,放弃了作为“人”的自由意志和责任,那么,这样的数据究竟有何意义?尽管大学排名数据改变了我们的生活,它能优化、提高、高效化并最终捕捉关于个人以及院校发展相关的各种利益。然而,排名指标和数据并不是一个仅仅充斥着评价法则和机器的冰冷世界,“人”在其中仍然扮演着重要角色。无论是进行大学排名机构的研究人员,还是利用大学排名进行院校决策的管理人员,都有其弱点、错觉和错误,而另一头连接的就是人的创造力、直觉和天赋。以往的院校研究以及院校发展决策在运用大学排名的数据方面,主要分析和关注排名的精确结果,忽视了排名的复杂性以及作为全体数据在院校发展中的价值,排名机构也往往被视为冰冷的及其和利益驱使的机构。事实上,指标的设计和数据变化也从一定程度和侧面体现出市场化和国际化力量的共同推动下高等教育发展的趋势和变化。因此,大学不仅要接受评价机构给出的评价结论, 还要透过这些指标和数据结合自身运行实际去预测大学未来的发展。
预测未来最好的办法就是创造未来。对于院校发展来说,要摆脱大学排名数据独裁的困境,需要所有相关个体发挥出“人”的创新能力,不仅是管理者,也包括教师、学生和员工,他们的共同努力将成为创造和实现院校未来发展的坚实基础和推动力。
来源:《中国高等教育评估》,作者系山东科技大学发展规划处(高教研究室)西南大学教育学部博士研究生。