深度学习视角下的评价科学方法创新

发布时间：2022-04-09 16:32所属平台：学报论文发表咨询网浏览：次

　　摘要：【目的/意义】评价科学是哲学社会科学体系的重要组成部分，其方法体系的构建需要依赖现代技术的支撑，科学的评价方法体系能够极大地提升评价活动的效率。深度学习技术的发展为评价科学方法体系的构建带来了前所未有的机遇。【方法/过程】本文通过文献计量、

　　摘要：【目的/意义】评价科学是哲学社会科学体系的重要组成部分，其方法体系的构建需要依赖现代技术的支撑，科学的评价方法体系能够极大地提升评价活动的效率。深度学习技术的发展为评价科学方法体系的构建带来了前所未有的机遇。【方法/过程】本文通过文献计量、文本分析等方法，运用 ITGInsight 科学计量工具，对深度学习技术及其应用于图书情报学科和评价科学的发展现状进行整体的梳理，并对基于深度学习的评价科学方法研究进行了系统的总结与分析。【结果/结论】最终分析得出了深度学习及其应用于图情学科和评价科学的主要研究情况，以及深度学习技术给构建评价科学方法体系带来的主要影响和潜在的发展机遇，并创造性地构建了一个基于深度学习技术的评价科学方法体系框架。【创新/局限】本文对于基于深度学习的评价科学方法研究具有框架层面的指导作用，但未曾就具体的方法过程进行讨论和实证研究，这将是相关研究接下来需要关注的内容。

　　关键词：深度学习;评价科学;评价方法;方法体系;学术评估;科技评估;教育评估

深度学习

　　1 引言

　　评价活动是一种人类社会发展过程中衍生出的社会实践活动，其质量与水平依赖着相关科学发展的先进程度。评价科学是涵盖学术、技术、教育等社会活动各方面的交叉性社会科学。在全球化背景下，国家之间都在秉持着世界眼光互相学习先进的经验、道路和理论。但由于我国在意识形态等方面与西方国家的冲突从未解决，西方对中国以“文化渗透”形式的力量交锋愈演愈烈。我国著名经济学家卢周来指出，中国作为一个自古重“说法”的民族，对话语权问题的重视是与生俱来的[1]。

　　习近平同志在 2018 年全国宣传思想工作会议讲话上指出，“要加强传播手段和话语方式创新”，“建设具有中国特色、中国风格、中国气派的哲学社会科学”[2]。要想提升中国哲学社会科学体系的国际影响力，势必应当加强学术层面的钻研和探讨[3]。已有学者对当前评价科学的理论和方法进行了系统的梳理和反思，认为存在方法陈旧、基础薄弱，指标体系不完善等问题[4]。

　　随着计算机科学中人工智能分支的迅速发展，深度学习技术成为解决人工智能问题的一种热门方法。一部分简单的机械性工作能够由机器代替人类完成，甚至能够模拟人类思维进行简单的推理和判断。这对于评价科学来说意味着指标的验证、方法的拓展将有望实现历史性的突破。本文将通过文献计量、文本分析等方法对深度学习技术的发展情况及其在图书情报学科中的应用情况进行梳理，对基于深度学习的评价科学方法研究进行系统的总结与分析，旨在梳理出深度学习技术可能给构建评价科学方法体系带来的机遇，尝试构建基于深度学习的评价科学方法体系框架，以及现有研究为我国该领域后续研究带来的启示和思考。

　　2 深度学习技术及其在评价科学中的应用发展现状

　　深度学习技术是人工智能领域最新最热的主题，它为科研和行业带来的方法性变革引起了国内外学者的重点讨论。近年来围绕深度学习技术发表的学术成果数量巨大，并且除计算机科学以外的其他学科也纷纷将深度学习技术引入自身的实证研究方法体系中，辅佐本学科的科研活动。

　　其中以图书情报(以下简称图情学科)为代表的社会科学也得益于深度学习技术在处理大规模文本数据、图像数据上得天独厚的优势，学科内部开始着眼于开发基于深度学习技术的创新型研究方法体系。作为唯一衍生于图情学科的研究方法，传统的计量学方法囿于体系的固化，指标的限制，很长时间难以突破实证研究中的瓶颈，用于评价活动中产生的结论和决策也容易具有局限性，不适应现如今评价数据源大规模、多模态的特征。

　　计量学目前仍然是评价科学最主要的方法支撑，但深度学习技术的出现能够很好地补充现有各类型评价体系中的数据方法和计量指标，因而它成为当前以及未来一段时间内评价科学需要重点关注的研究主题。本节将从深度学习技术自身，深度学习在图情学科中的应用现状，以及深度学习在评价科学中的应用现状层层展开，系统梳理现有研究取得的成果，呈现的特征，以及存在的不足，为接下来构建基于深度学习技术的评价科学方法体系提供支撑。

　　2.1 深度学习研究的主题演变和学科应用情况

　　深度学习技术的主要任务在于构建模拟人脑进行分析与学习活动的神经网络。根据黄立威等人[6]和 Shrestha A 等人[7]对深度学习技术主要算法和架构的梳理总结，目前较为常见的深度神经网络有：卷积神经网络、残差网络、自动编码器、对抗网络、受限玻尔兹曼机、循环神经网络、递归神经网络、径向基神经网络、深度信念网络，以及 Kohonen 自组织神经网络等。

　　因此，以“("deep learning" OR "convolutional neural networks" OR "residual networks" OR"autoencoder" OR "adversarial networks" OR "restrict boltzmann machine" OR "recurrent neuralnetworks" OR "LSTM" OR "recursive neural networks" OR "RBF networks" OR "SOM" OR “deepbelief networks”) NOT education”作为主题关键词在 Web of Science 核心合集数据库中进行精确检索，截至 2021 年 12 月 31 日，国外发表的与深度学习技术相关的科学文献数量为 175508条，并且从 2015 年开始数量激增，可见这一主题热度之高，发展之迅速，成果之丰富。

　　将检索结果中相关度最高的前 5000 篇文献进行书目特征和文本特征的抽取，利用 ITGInsight软件工具对这些文献揭示的关键词和学科分布特征进行计量分析与可视化呈现，能够直观地展现深度学习领域目前为止的主题演变和学科应用情况。为了清晰地把握深度学习领域的发展脉络，本文依照时间顺序对该领域的关键词演化情况进行了梳理，并通过主题演化的形式进行可视化呈现，结果。由于相关成果在2015 年左右出现数量的激增，考虑到可视化效果，演化图只选择了 2015 年之后的数据。

　　根据 ITGInsight 工具官方网站给出的算法说明[8]，ITGInsight 借鉴王晓光等人开发的社区相似度匹配算法[9]，寻找主题在时间维度上的前驱和后继，进而识别主题网络中存在的产生、消亡、合并、分裂、扩张和收缩等演化过程。在呈现的演化图中，色块高度表示主题的节点规模，同一时段的主题色块也是按照节点规模从上至下排序的，色块间的连线表示主题间的前驱和后继关系，某一时段的主题同它的前驱越相似，则它们之间的连线越粗。

　　卷积神经网络是一直以来的研究热点，规模逐年稳步上升，近两年稍有下降。从主题诞生和消亡的情况来看，典型的是循环神经网络(Recurrent Neural Networks)这一主题自 2017 年后便消亡不再出现，而长短期记忆算法(LSTM)于 2018 年正式诞生。LSTM为循环神经网络的一种特殊形式，可见相关领域并非放弃了对循环神经网络的研究，而是专注于 LSTM 这一算法的探索。

　　另外与社会背景相对应，2021 年诞生了 COVID-19 这一新兴主题。从分裂和聚合情况来看，分割(Segment)这一主题从 2020 年后消失，但并不代表着消亡，而是分裂成了情感分析(Sentiment Analysis)、特征提取(Feature Extract)等具体问题。Optim 最优化函数这一主题也在 2020 年后消失，但它和数据训练(Train)等主题聚合成了数据模型(Data Model)这一主题，并在 2021 年出现。

　　从 2015 年至 2021 年，深度学习技术在各个学科的应用均呈现出明显的上升趋势，其中计算机科学和工程学一直以来都占据深度学习应用领域的主要版图，可以被认为是深度学习技术的发源学科。深度神经网络最早也的确是针对解决机械工程中的一些自动化问题的需求而重新引起的热烈讨论[10]。

　　近年来，深度学习技术更广泛地应用于电信、放射医疗、物理学、光学等学科中。这大多得益于深度学习技术在图像识别和处理问题上表现出的极高效能。从排名前十的应用学科来看，深度学习技术目前来说主要在自然科学，尤其是与计算机信息处理密切相关的实证科学上得到应用，在图情学科的应用对于整体数量来说占比很小，还有较大的应用空间值得探索。但随着深度学习技术在处理模型构建、特征提取与自然语言处理等问题上的实现和优化，它将逐渐拓展在社会科学、人文科学等学科研究中的应用版图。

　　2.2 深度学习技术在图情学科中的应用现状

　　2.2.1 图情学科中深度学习相关研究的主题现状

　　通过关键词的共现分析能够说明一个领域的研究主题构成，锁定当前研究热点及相对成熟的研究分支。在上述深度学习相关文献数据的检索结果基础上，笔者将学科限制在图情学科(Information Science&Library Science)进行二次检索，共得到 654 条检索结果。

　　节点大小表示其出现频次，具体频次数量体现为节点名称后的数字，节点间连线的粗细表示二者关联的强弱，基于关联关系的聚类结果通过不同的节点颜色体现。ITGInsight 科学计量工具在构建科研关系网络图的过程中借鉴了知识图谱工具 VOSviewer 的聚类算法[11]，其选用的聚类算法在如何定义簇的问题上采取的是相似度度量的方法。常见的相似度计算方法有余弦相似度和 Jaccard 指数，但 VOSviewer使用的是一种被称为关联强度的相似性度量[12]。

　　2.4 深度学习技术在评价科学中的发展现状

　　从图情学科中深度学习相关研究的主题现状来看，计量学是其中十分重要的一个研究方向，深度学习技术为计量学带来的方法性变革对于评价科学的方法构建具有非常大的影响意义。为了探究当前深度学习技术在评价科学中的现有应用研究有何特征和不足，在深度学习相关成果的检索结果基础上组合检索式 TS=("evaluation science" OR "informatrics" OR"bibliometrics" OR "scientometrics" OR "Academic evaluation" OR "journal evaluation" OR"Technology Evaluation")，最终得到 41 条检索结果。将深度学习技术引入评价科学中的研究从 2018 年开始逐渐出现。

　　在引入深度学习技术后，引文分析依然是评价科学尤其是学术评价研究中的重要主题，但相对于传统的引文分析方法，引入深度学习技术的引文分析将更加关注引文预测、引文分类等文本内容深层的评价分析。除此之外，评价指标的创新与体系构建也受到了一直以来的关注。2020 年以来也出现了一些新的研究主题，例如文本挖掘、技术预测以及可视化。

　　由以上结论可见，深度学习技术自诞生以来被广泛应用于众多学科研究当中，应用领域尽管以自然科学为主，但近年也在以图情学科为代表的社会科学中展现出巨大的应用潜力。深度学习技术在图情学科中的应用研究已经分化出了多个方向，国内以武汉大学为代表的科研机构在这一领域具有较强的科研实力，但与其他实力较强的国内外机构合作较少。深度学习在图情学科中的应用整体还处于探索阶段，理论和实践均不够成熟。笔者在梳理深度学习应用于评价科学的相关成果时发现，这类成果数量较少，中文成果更是几乎没有，说明尽管有着巨大的应用空间，但国内目前还较少关注到深度学习技术如何帮助完善评价科学的方法体系的问题。因而本文对基于深度学习的评价科学方法研究进行总结的过程中，参考的成果以英文成果为主。

　　3 深度学习技术为评价科学方法带来的影响

　　评价科学是一个从人类社会评价实践活动中抽象而来的知识体系，目前国内还未形成系统的学科建设，相关学者也暂时未对评价科学的概念界定达成统一的共识，这一领域在我国还处在研究框架、研究思路还不太统一和明晰的探索阶段。但已经有学者尝试从科学学、科学学科学的角度对我国的评价科学研究进行学科建设层面的总结和评论[13]。也有学者曾论述过构建完整的评价科学理论、方法与应用体系之于国家发展的重要性，以及拓展评价科学指标维度，丰富我国评价科学方法体系的重要意义[4]。

　　3.1 深度学习为学术评估带来的影响

　　学术研究是衡量一位科研工作者工作产出和工作成果的核心标准，科学的科研评价活动能够起到有效鼓励和监督学术科研活动，引导科学持续发展的作用。但传统的基于同行评议的科研评价体系显然已经无法适应科学发展的新环境，以数量为主的学术评估理念也带来了一系列不良影响，造成不少学术乱象。为了解决以上问题，国内外相关科研机构正在不断探寻对现有科研评价体系具有补充和变革意义的评价思路和方法，国际学术评估出现以社会价值为导向、评估手段多元化、评估过程自动化，评估内容深层化的趋势[14]。相比于部分西方国家的科研评价现状，我国长期以来对学术成果数量的过度重视而忽略了成果质量的评价[15]。

　　深度学习技术能够大幅地减少特征工程的时间成本，且在情感分析和功能分类工作中也表现出很大的优势[16]，将是评价学界重点关注的方法技术。通用技术指的是可应用于许多行业的关键技术，深度学习是人工智能系统的核心技术，越来越被认为是转型通用技术的最新例子[17]。对于学术评估和科研评价来说，引文信息是最重要的研究质量和影响评价源，但鉴于文本内容分析技术的发展局限，在一段时间内的引文分析都停留在计量层面或浅层的内容分析层面。深度学习技术为学术评估方法带来的影响主要在于：一为基于元数据和文本内容的引文预测的实现，二为基于引用动机和引用情境的引文分类的实现。

　　4 基于深度学习的评价科学方法体系

　　构建数据是贯穿深度学习技术实现的基础，也是评价活动得以开展的依据。深度学习技术对文本和语义信息的处理能力和学习能力让评价过程尤其是质性评价不再缺乏客观依据，同时能够极大地提升评价效率。深度学习是机器学习模型中一个十分重要的分支，它涵盖的是使用具有多个隐藏层的人工神经网络用于解决分类或回归问题的方法[67]。深度学习相对于传统的机器学习算法，在评价科学中具有的适应性表现为以下几个方面：

　　(1)深度学习技术相比机器学习提供的是一种端到端的问题解决过程。相关人员无需花大量的时间和精力在输入数据的特征提取工作上，只需选择合适的神经网络架构即可，很大程度上减轻了人工处理的负担。(2)深度学习技术在特征提取阶段具有较强的可泛化性和适应性，而机器学习所需的特征工程是严格按照特定领域和特定应用变化的。评价工作的性质决定了评价对象的领域和特性跨度较大，繁杂重复的特征提取工作将大大降低效率。

　　(3)深度学习技术当前已经在解决文本分析与识别的问题上体现出了优秀的学习能力，在字符和语音的识别分类上准确度均比较理想[68]，在特征提取的问题上能够跨越语言、形式和载体的限制，对于评价科学来说很好地切合了评价依据从固化的数据指标评价向内容成果评价转型的需求。基于深度学习技术的评价科学方法体系应当遵循评价科学中数据的一般处理过程，大致可以分为数据收集，数据分析，科学预测三步。

　　5 结语

　　深度学习是当前各学科普遍关注的方法主题，在图情学科中的研究表现也颇具潜力。评价科学是图情学科的重要组成部分，构建基于深度学习的评价方法体系，是推动我国评价科学发展的重要任务，是提升我国文化软实力和核心竞争力的关键一环。评价方法体系的构建依赖于科学研究的发展和技术水平的进步。

　　技术机遇转瞬即逝，要想加快我国评价科学的研究步伐，提升我国在评价领域中的影响力和在评价活动中的参与权和决策权，深度学习技术将会是重点攻关领域。基于深度学习的评价科学方法体系应当遵循数据收集，数据分析，科学预测的研究路径，攻克不同评价领域在各个阶段的技术难题。同时应当正式现有研究存在的不足，利用好现有研究带给我们的启示：①钻研技术研究，解决现有技术局限问题;②重视体系构建，提升中国话语权评价方法体系的科学性和完整度;③做好平台建设，深化代表中国声音的评价科学的国际影响。

　　参考文献

　　[1] 复旦大学中国研究院 . 卢周来：争得国内外的中国话语权 [EB/OL].

　　[2] 中华人民共和国中央人民政府. 习近平出席全国宣传思想工作会议并发表重要讲话[EB/OL].

　　[3] 韩庆祥.全球化背景下“中国话语体系”建设与“中国话语权”[J].中共中央党校学报,2014,v.18;No.89(05):47-50.

　　[4] 赵蓉英,王旭,亓永康,常茹茹,张兆阳.中国话语权视域下的评价科学研究述评[J].现代情报,2019,v.39;No.340(10):145-153+176.

转载请注明来源。原文地址：http://www.xuebaoqk.com/xblw/7477.html

《深度学习视角下的评价科学方法创新》

上一篇：西部地区推进农村农民共同富裕的内在逻辑与实现路径
下一篇：水利建设工程文明安全标准化工地创建

深度学习视角下的评价科学方法创新

学报论文发表期刊

热点学报

学报问题

热点问题