公共政策评估
出自 MBA智库百科(https://wiki.mbalib.com/)
公共政策评估(Public Policy Evaluation)
目录 |
公共政策评估是指特定的评估主体根据一定的标准和程序,通过考察政策过程的各个阶段、各个环节,对政策的效果、效能及价值所进行的检测、评价和判断。
西方政策学家和政策机构对政策评估的性质进行过研究。他们从不同的角度对政策评估进行了分析,其中有代表性的观点是由奎德、古巴、林肯等人提出的。比如,E·S·奎德就认为,从广义上解释,政策评估是确定一种价值的过程分析,但在狭义上,却是在调查一项进行中的计划,就其实际成就与预期成就的差异加以衡量。
再如,古巴与林肯(Gubaand Lincoln)在讨论政策评估的性质时,先将政策评估划分为四代,并确定了不同代的政策评估的内容。他们指出过去的政策评估可分为三代,第一代是测量取向的评估;第二代是描述取向的评估;第三代是判断取向的评估;第四代评估则是特别重视政策利害关系人对于政策的反应态度与意见的评诂。
另外,美国"都会研究所"对政策评估的性质也作了规定,他们认为政策评估的目标是:衡量一项进行中的计划所达成预期目标的效果;根据研究的原则区别计划效力与其他环境力量的差异;透过执行上的修正使计划得以改善。
将西方政策学者和政策研究机构关于政策评估性质的观点与我国的政策评估实践结合起来思考,可以将政策评估看成是依据一定的标准和程序,对政策过程的效果、效益、效率和公众回应加以判断、评定并由此决定政策变迁的活动。公共政策评估活动中包括着规范、测度、分析、评判四个环节。规范环节的任务是建立政策评估的标准与程序,这是整个评估活动的前提;测度环节的任务是收集评估对象的各方面信息,这是评估活动的基础;分析是运用已收集的信息,对政策实施结果进行评定,这是评估活动中关键的一步;评判环节的任务是对政策的变迁提出建议,这是评估的完成。
政策评估与政策执行是政策过程的两个不同阶段,它们在组织、资源、个人责任、机构间的沟通等方面都存在区别。
公共政策评估可以按不同的标准进行分类。但过多过细的分类并没有太多的实用价值。从评估的实际出发,可以对公共政策评估作出三种分类:正式评估与非正式评估;对象评估、专业评估、自我评估;方案评估、执行评估、终结评估等。
- 正式评估和非正式评估
这类评估是从评估活动的方式来划分的。正式评估是指事先制定完整的评估方案,由专门的机构与人员按严格的程序和规范所进行的政策评估。这种评估由于评估机构与人员具有专门的知识与素养,评估的资料详尽真实,评估方法手段先进,因而评估的结果比较客观、可信。
非正式评估是指那种对评估者、评估程序、评估方法、评估资料都未作严格要求而进行的局部的、分散的政策评估。非正式评估虽然结论不一定非常可靠、完整,但其形式灵活、简单易行,有广泛的适用性。
这两种评估活动方式可以有机结合起来运用。以正式评估为主,将非正式评估作为正式评估的事先准备和必要的补充。
- 对象评估、社会评估、自我评估
这类评估是以不同的评估者来划分的。对象评估是指由政策目标集团成员进行的评估。由于政策目标集团成员是政策的承受者,他们对政策制定与实施的利弊得失有最真切的感受,对政策的成果最有发言权。因此,这种政策评估可以获取第一手资料,可以对政策的成效有真实的估计,其结论具体、真切。但这种评估也有不足之处,目标集团成员只是社会的一部分,提供的资料虽然真实,但有较大的局限性。
社会评估是指在政策系统之外所进行的评估。通常有两类:一类是政府等公共部门委托的专业评估;一类是社会成员自行组织的评估。对象评估与社会评估可以统称为外部评估。政府委托评估是政府部门委托专业性的咨询公司、盈利或非盈利性的研究机构、大专院校的专家学者所进行的政策评估。这种评估的优点在于评估者在一定程度上能置身于政策系统之外,从而使评估具有较大的客观性;实施评估的机构与人员一般都具有专门的评估理论与知识、方法与手段、实践与经验,从而使评估具有较高的可靠性。但这种评估也有其局限性,主要是评估机构与人员容易受委托者在经费和资料两方面的限制,从而有可能削弱评估的客观性与公正性。
自我评估是由政策系统内部进行的评估。这种评估的优点在于,评估者中有政策的制定者与执行者,对整个政策过程有全面的了解,掌握大量的第一手资料,从而评估的结论较为可靠。另外,从评估的实用性来看,政策系统内部评估的结论可以直接被用于政策调整,容易产生效用。但这种评估也有其缺点,由于评估者是政策的制定者与执行者,可能会因为顾及政绩而夸大成绩、回避失误;可能会从部门的局部利益考虑而产生片面性;可能会受到机构内部利益和人际关系影响而失去公正性。
- 方案评估、执行评估、终结评估
这类评估是以评估实施的阶段来划分的。方案评估是在政策实施前进行的评估,因此又称预评估。由于政策还未执行,因此评估是预测性的。评估者往往根据以前积累的经验,加上运用现代电脑技术进行模拟运行,对方案执行后可能出现的效果作出分析与估计。这种评估的优点在于,评估的结果可以直接用来指导政策的实施,特别是可以采取措施,将可能出现的政策负面效应减少到最低程度。但这种评估终究只是预测的,还不是现实的结论。
执行评估是在政策实施过程中进行的评估。虽然这时的政策执行还未结束,但政策推行的效果、效率、效益已经表现出来,特别是政策方案中存在的缺陷、政策资源配置中的问题、政策环境中某些条件的改变等,已经暴露出来。这种评估的优点在于评估中所获取的资料都是即时的、具体的,评估的结论是真实的、可靠的。另外,评估的结果也能立即和直接产生作用,用来对正在执行中的政策进行调整。但执行中的评估只是对进行中的一定过程所作的评定,由于过程并未结束,所以评估带有过渡的、暂时的性质。
终结评估是指政策执行完成后的评估,这是对一项政策的最终评估。由于政策已经执行完毕;政策的最终效果、效率、效益已经成为客观存在,评估的结论是对政策全过程的总结。这种评估要求对政策全过程有充分的认识,对政策实施后的结果有全面的把握,对以往的方案评估、执行评估有详尽的了解。
政策方案的评估主要为政策执行提供指导;政策执行评估主要用于对政策运行加以控制;政策终止的评估主要对政策制定提供指导。这三种评估分阶段贯穿于政策的全过程。
上述三种不同分类的评估可以相互结合起来使用。无论是对象评估、社会评估、自我评估,还是方案评估、执行评估、终结评估,都可以是正式评估,也可以是非正式评估;方案评估、执行评估、终结评估可以与对象评估、社会评估、自我评估结合起来。
在公共政策周期中政策评估占有极重要的地位。
首先,政策评估有利于检验政策的效果、效率、效益。
其次,政策评估有利于提高决策的科学化和民主化水平。
第三,政策评估有利于实现政策资源的有效配置。
第四,政策评估有利于决定政策的循环形式。
政策评估的过程是个非常复杂的过程 , 必须围绕着公共策及其活动全过程的各个环节的结果的价值进行评估。在此 , 笔者认为目标标准、投入标准、公平与公正标准、效率标准和公民参与与回应这五个方面应是公共政策评估标准的必要内容
- 政策的目标标准
政策目标是制定政策的起点 , 也是政策制定所要实现的终点。政策目标在政策执行中具有指导、约束、凝聚、激励、辐射的作用。评价一项公共政策是否成功的重要标志就是看政策执行后能否在预定的时间内完成其所预定的目标。那么 ,在评估政策时 , 把制定公共政策时所要达到的标准或目标同在一定时间限度内执行政策所达到的目标相比较来进行评价。如果公共政策在预期时间内取得的成就同制定政策所定的标准一致 , 那么 ,这项公共政策就是成功的 , 达到了预期的目标。反之 , 没有达到所希望达到的目标 , 这说明这项政策是不成功的。因此 , 评价公共政策是否成功的第一个标准应该看公共政策在预期的时间内是否完成或实现了预期的目标或标准。
- 政策的投入标准
一项政策从提出、列入议事日程、制定、执行等各个环节都需要大量的人力、物力、财力、信息等各种资源。也就是说要制定、执行和贯彻公共政策必须有一定的投入 , 这些投入包括: 资金的来源与支出 , 所需要的执行政策的人员、机构、工作时间的数量与质量 , 政策资源与政策对象之间的相互关系等[10]。这个标准要衡量一项政策所投入的各种资源的质量和数量 , 其实质就是从资源投入的角度来衡量决策机构和执行机构所做的工作 , 也就是政策评估的成本问题。因此 , 投入成为政策能否取得成功的重要因素。所以 , 评估一项政策能否成功的一项重要的标准可以从各种投入方面进行评估。但是在运用这个标准评估公共政策时 , 我们应该认识到投入只是公共政策成功的充分条件 , 而不是必要条件。大量的投入并不一定就能导致政策的成功 , 反之 , 投入不足也不意味着政策就不能取得成功。
- 政策的公平与公正标准
公共政策是政府依据特定时期的目标 , 在有效增进与公平分配社会公共利益的过程中所制定的行为准则 , 公共性是公共政策的重要特征和体现。由于市场本身的缺陷 , 在社会资源的分配和调节方面存在市场失灵的问题 , 政府的公共政策应该发挥其调节作用 , 而这种调节作用更多的体现在社会公平方面。因此 , 政府在制定公共政策的过程中应该以社会利益最大化为其目标 , 最大限度的体现最大数的利益 , 尽可能的实现帕累托最优。同时 , 由于政策在满足大多数人利益的同时 , 也可能导致一部分人的利益受到损害。为了实现帕累托最优 , 就要求必须注意那些由于政策因素导致合法利益受损的少数人群体或部分利益集团的利益 , 通过利益的再分配或补偿等方式给予那些受损的合法利益以合理的补偿 , 从而体现和照顾最大数人的利益。因此 , 公共政策是否成功的重要标准之一就是看是否体现的政策的公平和公正 , 是否体现和维护了最大数人的利益。
- 政策的效率标准
经济学上讲究经济效率即投入和产出的关系 , 经济效率要求产出必须大于投入。政策的效率标准是衡量政策取得效果所耗费的政策资源的数量 , 通常体现在政策投入与政策效果之间的比率和关系。政策效率的高低往往反映出政策本身的优劣和政策的执行状况。一般来讲 , 政策的效率标准包括三个层次[11]: 政策的成本层次、单项政策的投入和产出层次、政策的全部成本与总体产出层次。在政策成本层次上 ,必须掌握政策过程中的资金来源和支出 , 物质与信息的调配与使用 , 决策者与执行者的数量和时间。在这里 , 应重点关注政策在制定和执行中投入了多少资源 , 投入的资源是否充足 , 能否能确保政策得到贯彻和实现。在单项政策的投入和产出层次上 , 考虑政策效率时应该重点关注如何以较少的投入、较快、较好、高质量的实现政策目标 , 也就是在最小的政策成本下达到和实现最大的政策目标。在政策的全部成本与总体产出层次上 , 应该注意除了直接用于政策过程的资源外只用于该项政策 , 而不能用于其他方面 , 由此造成的机会成本有多大; 该项政策实施后所产生的直接效果以外的附加效果、象征效果、非预想效果等间接效果有多大。这种层次的评估重点在于政策系统与社会整体系统之间的关系。在这种层次上 , 评估公共政策不仅要考虑政策本身的效益 , 还要考虑执行政策后带来的社会效益。如,国家的退耕还林工程,不仅起到了保护生态的作用,也对还林区从旅游等方面带来了经济效益。
- 公民参与与回应标准
由于公共政策主要实现大多数人的利益 , 因此 , 在制定政策的过程中公民的参与与回应就显得很重要 , 而公民的参与和回应程度的高低也是衡量政策是否成功的重要标准。公共政策对社会需求的回应是一个国家或政治系统维持自己生存、稳定和发展的基本功能。通过公民的广泛参与 , 各种社会问题不断输入到政治系统中 , 政治系统则不断地输出各种政策去解决各种各样的社会问题 , 维护和实现公民的利益。因此 , 一项公共政策不论关系到全体或一部分人的利益时 , 只要政策对象认为满足了自己的利益 , 就会对这种政策有着积极的回应。反之 , 政策的回应程度就低。这也是评价政策是否成功的重要标准。政府制定公共政策的目的主要是满足社会全体或部分公民的利益需要 , 制定的政策必须为公民所接受。但是 ,在一些政策制定过程中 , 由于政府从自身利益出发在没有公民广泛参与的情况下制定出某些公共政策 , 原本以为体现和维护了公民的利益 , 必然得到公民的支持与欢迎 , 但结果是公民对制定的政策缺乏认同感。原因在于 , 政府把公民不需要的政策强加给公民 , 必然得不到公民的认同。我国有些地方政府制定政策缺乏公民认同的现象时有发生。如许多地方的领导干部为了展现自己的 “ 政绩 ” , 脱离了本地社会、经济发展的实际情况超前制定了许多政策 , 结果导致了政策不被公民认同 , 出现了大量的人力、物力、财力的浪费 , 严重损害了本地人民的利益。
一般都要经历评估的组织准备、实施评估,以及撰写评估报告和总结这样三个相互关联的阶段。
1.组织准备
这一阶段的主要任务包括:
(1)确定评估对象。
(2)制订评估方案。
(3)挑选和培训评估人员。
2.实施评估
实施评估阶段的主要任务包括:
(1)利用各种调查手段广泛收集公共政策信息。
(2)综合分析公共政策信息。
(3)综合运用相应的评估方法具体进行评估。
(3)撰写评估报告和总结。
这个阶段包括两方面的内容,一是撰写评估报告,二是总结。
政策评估中有许多制约因素,有些是属于客观条件的限制,有些是评估主体的限制,有些是评估客体的限制。
政策目标的不定性
由于政策所要解决的问题很少是单一的,常常是许多问题纠缠在一起,其中任何一个问题又包含着许多复杂的方面。这就决定了政策目标的多样性、复杂性。再加上政策目标是在多个利益集团、不同公众群体的利益协调、平衡中确定下来的,为了兼顾各方面的利益关系,目标只能是宽泛的、含糊的。目标过多、过于宽泛含糊,就会增加评估的难度,有时甚至很难判断具体政策实施后是达到了还是没有完全达到预定效果。
政策影响的广泛性
确定政策影响对政策评估十分重要。但是,一项政策实施后,究竟产生了哪些影响,这些影响的程度如何,并不都是很清楚的。有些政策影响是显露的,有些影响则是潜在的;有些政策影响是具体的,有些影响则是抽象的;有些政策影响能迅速表现出来,有些影响则要经过一个较长时间才能显示出来;有些政策影响是表层的、象征性的,有些影响是深层的、实质性的。如果要想进一步弄清各种影响的程度,那就更为困难。
政策资源的混合性
准确地计算政策投入的多少对政策评估具有非常重要的意义。但是,政策资源的投入常常是混合的,因而无法准确地加以计量。常见的政策资源混合有同时投入的混合与不同时投入的混合。前者发生在公共机构资源投入的共享上,公共机构某个时期投入的资源是供多个政策使用的,相当多的资源是多个政策共享的,要把每个政策的投入都清楚地区分开来事实上很难做到。后者发生在新旧政策资源的共享上,旧政策终结,原来投入的资源就成为沉淀成本;新政策是在旧政策的基础上实施的,究竟有多少沉淀成本转而成为新政策的投入,往往难已搞清。
评价信息的短缺性
资料和信息是政策评估的基础,因此,要对政策进行充分的、科学的评价,就必须占有详细的、真实的统计资料和政策信息