政策文本计算:理论、方法与实证
上QQ阅读APP看书,第一时间看更新

前言

政策文本在我国政治体系中发挥着不可替代的作用,随着大数据和人工智能技术的进步与发展,政府信息公开及数据开放的广度和深度不断延伸和拓展,无论是情报学领域还是公共管理学领域,对政策研究都提出了更高的标准,由此政策文本计算得以产生。这是一种理性挖掘政策文本潜在知识、探索政策演进规律、预测政策发展趋势的新方式,它融合了公共管理领域的政策过程分析特点,情报学和文献信息学领域的政策文本量化研究思维,数据科学、计算机科学中大数据及人工智能的计算方法。政策文本计算的核心是针对政策文本的数据分析与知识发现,因此对政策文本计算的背景理论、技术方法及应用实证的研究是其三大支柱。政策文本计算在改善政府决策机制、实现决策科学化、提升政策执行力等方面具有重要研究意义。虽然当前政策文本计算已形成一系列研究成果,但学界应该对政策文本计算理论、方法及应用做出更加清晰、更加规范、更加系统的概括和阐释,以期将情报学理论作为切入点把目前的“散论”聚合为一个有范畴、有阐释、有应用的较完整体系,本书应这种时代要求而著。本书的宗旨是在大数据、人工智能技术的快速发展及交叉学科融合背景下,重新审视、概括和阐释政策文本计算的背景理论、技术方法及实证应用。成果从上、中、下三个篇章对该问题展开论述。

上篇是背景理论。主要介绍政策文本计算的起源与发展和交叉学科融合下政策文本计算的基础理论。政策文本计算的起源与发展分为五部分,一是起源,在20年的发展过程中,国外学者从技术、方法、工具等视角针对政策文本展开研究,伴随着技术的持续发展,政策文本计算近年来在国内得到了快速发展与认可;二是概念界定,对政策文本概念、特征及政策文本计算概念及边界进行界定;三是基本原则,政策文本计算的四项原则为使用和评估政策文本计算方法提供了有用的指南;四是研究视角,从理论范式、技术方法、应用场景三个研究视角对政策文本计算进行诠释;五是研究方向,分析政策建模仿真、政策文本解读、政策文本比较、政策内容协同、政策文本分类、政策主题演化六大领域在政策研究中的重要作用。政策文本计算的理论基础详细剖析了政策文本计算定位,政策文本计算与情报学、文献信息学、公共管理学、系统科学、数据科学、计算机科学之间的密切联系,并将情报学理论作为政策文本计算与其他学科交叉融合的切入点,形成完整的政策文本计算基础理论。

中篇是技术方法。通过介绍系统建模仿真、政策语料库构建、政策文本计算方法等形成适用于政策知识提取的“中间层”方法。系统建模仿真分为系统动力学和复合系统协同度模型,将政策文本计算与系统建模仿真方法相融合研究能够形成科学化政策预测。政策语料库构建是政策文本计算的基础,详细阐述了政策语料库现状、构建过程、方法及实际应用。政策文本计算方法中包括了文本预处理、文本相似度计算、主题模型、命名实体识别、词向量模型、深度神经网络和知识图谱等。

下篇是应用实证。应用实证能够获得客观的、可重复的、可验证的分析结论,从微观层面对单个或少量政策进行政策建模仿真、政策文本解读、政策文本比较、政策内容协同等实证,从宏观层面对大量政策文本进行政策文本分类、政策主题演化等实证,以发现政策演化规律以及预判发展趋势。在实证应用领域主要基于大数据、人工智能、知识产权等政策进行分析,应用实证部分将交叉学科理论与方法紧密融合,并形成了理论上可运用、方法上可借鉴、应用上可参考的研究成果。

政策文本计算是数智时代认识政策文本的新手段,它能有效地为政策制定提供理论解释和证据,在推动政策制定与执行、预判政策趋势、推演政策脉络、纠正政策的偏差误区等方面能够发挥重要作用。本书从实际应用出发,详细展示了政策文本计算从理论、方法到实证检验的研究逻辑,以期对有意愿从事政策文本计算研究的师生、研究者有所裨益。

本书提出和论证以下重要观点:第一,提出政策文本计算是数智时代对政策文本的一种非介入性研究。当前政策研究中广泛使用控制论、运筹学、系统分析或博弈论等过程分析方法,这些研究均是对预设框架的验证。而政策文本计算结果具有中立性与客观性,弱化了研究者因政治立场偏见、被调查者(样本)主观偏向而带来的瑕疵,并且能够实现研究结果的可重复。应用实证中的案例均是对实际政策文本计算后进行中立性与客观性的分析。第二,将情报学理论作为政策文本计算与其他学科交叉融合的切入点,形成完整的政策文本计算基础理论。数据爆炸式增长和数据开放的整体趋势决定了政策文本计算将融合情报学、政策科学、数据科学、计算机科学等领域的理论,将形成以情报学理论为切入点的交叉学科研究体系。第三,从基础研究方法走向适用于政策知识提取的“中间层”方法是形成政策文本计算方法体系的关键组成部分。政策文本计算深入挖掘日益复杂的政策研究问题,其主要目标是发现隐藏在政策文本中的潜在知识,使政策研究更具前瞻性和科学性。当前研究方法包括系统建模仿真、主题模型、知识抽取等,研究方法边界仍在向深度学习继续扩展。这些研究方法简单重塑或再重构,从方法论角度已经形成了意识介入问题,因此要形成适用于政策知识提取的“中间层”方法。第四,政策文本计算能够成为情报学领域对政策研究的一类重要理论与方法集合,并服务于更广泛的政策研究领域。通过政策文本解读、政策文本比较、政策内容协同、政策主题演化等应用实证能够对政策文本计算理论与方法进行有效性验证,也是学界认可、社会推广的重要环节。

本书的主要创新包括:第一,理论创新。本书旨在提出以情报学理论与其他学科交叉融合为切入点的完整政策文本计算基础理论,将计算机科学、数据科学、系统科学的方法扩展到政策研究中,通过对政策文本计算挖掘隐藏在政策文本的潜在价值,以突出情报学领域学者对政策信息学与政策智能的研究介入。第二,方法创新。当前在政策信息学中“中间层”方法受到学界的广泛关注。本书旨在提出从基础研究方法走向适用于政策知识提取的政策文本计算“中间层”方法,这部分形成政策文本计算方法体系的关键组成部分。第三,内容创新。本书致力于将目前政策文本计算研究的“散论”聚合为一个有范畴、有阐释、有应用的较完整内容体系。在政策研究向科学化、计算化发展的背景下,梳理政策文本计算的发展、理论与方法,对政策文本计算研究的理论价值和实际应用做出全过程阐释,这是利用计算方法对政策文本系统化、深层次挖掘的创新体现,为我国数字化转型期的政策研究提供一种计算范式和视角。

本书的学术价值包括:为情报学领域学者探索政策信息学注入新动力,有助于推动文献信息学及政策信息学理论与方法研究的进一步发展,这也是推出本成果的初衷之一。近年来,我国情报学、公共管理学等领域学者不断探索完善政策信息学理论与方法,尤其是2020年第260期双清论坛(双清论坛是国家自然科学基金委员会确定优先投资领域的重要途径之一)主题为“政策信息学与政策智能”,突出了政策信息学与政策智能研究的重要战略意义,而政策文本计算是政策量化研究中的重要组成部分,扩充国家智库建设和政策研究中的量化分析手段。其学术价值和实践指导意义是不言而喻的。当前智库研究及政策研究广泛使用控制论、运筹学、系统分析、博弈论等过程研究方法,这些研究均是对预设框架的验证,可能因政治立场偏见、被调查者(样本)主观偏向而带来瑕疵。政策文本计算研究具有良好的中立性与客观性,能够理性展现政策的偏差误区、预判政策走向、推演政策发展脉络,这是智库研究及政策研究手段的一种扩充,有助于政策制定者、学术研究者形成更全面、更准确、更有价值的研究成果。

本书为集体智慧和劳动的成果,由张涛(全书的撰写、大纲拟定、统稿、定稿及审校)、马海群(全书的撰写、大纲拟定、定稿及审校)、姜磊(第五章部分小节的撰写)、刘兴丽(第九章部分小节的撰写)和蔡庆平(第十一章部分小节的撰写)共同完成。我的硕士研究生崔文波、李金玲、汪颖、王瀚功、王铮、韦晓霞、高鑫鹏、于同同为本书撰写与校对付出了大量的辛苦,向他(她)们表示深深的谢意。本书的出版得到中国社会科学出版社以及程春雨女士的全力支持。本书难免有疏漏之处,衷心欢迎各位专家、学者和广大读者批评指正,共同推动政策文本计算研究的不断深入。

张涛

2023年春于哈尔滨