房地产信心指数
出自 MBA智库百科(https://wiki.mbalib.com/)
房地产信心指数(Real Estate Confidence Index)
目录 |
什么是房地产信心指数[1]
房地产信心指数是指基于科学的理论方法,通过对反映房地产市场供应与需求的各项具体指标以及与房地产市场发展相关的社会经济多项指标的调查分析(结合统计指标与大量反映消费、投资需求的抽样调查指标),对影响房地产市场的各项因素做出定性与定量分析;通过客观全面的市场调查,对这些因素按其重要程度进行归类和数据处理,并通过科学的方法把处理后的数据进行合成,得出反映和测度政府、消费者、投资者对房地产市场运行状况、景气程度、均衡程度的信心指数(含单项指数与综合指数)。
房地产信心指数的研究意义[1]
1.理论意义
(1)有利于完善房地产市场宏观调控理论 虽然市场能够根据供求关系进行自我调节,但这种调节难免会出现消极、被动、滞后和带有局部性的缺陷,即市场失灵。鉴于此,不论是西方发达国家,还是新兴的资本主义工业化国家,为避免经济发展的盲目性,都很重视宏观经济调控问题。由于房地产开发与国民经济的发展密切相关,因而如果把房地产开发单纯地交给市场去组织,很可能出现“过热”或“过冷”的现象。而政府对其采取一定的政策措施加以干预,可能会取得更好的效果。因此,对于房地产宏观调控理论的研究也一直是一个重要课题。一个完善的宏观调控体系是指中央政府通过经济、法律、行政及舆论导向(信息引导)等手段,对整个社会经济总需求和总供给进行调接和控制的系统,它是一个由调控机构、调控目标、调控手段、政策措施等构成的一个有机的相互作用体系。现有的房地产市场调控手段仍然是以经济、法律及行政手段为主,这已不能满足社会主义市场经济发展的需要,以经济、法律手段为基础、以信息引导和预警体系为主导的房地产宏观调控体系,则是宏观调控理论发展的未来趋势。因此,建立房地产信心指数体系,作为宏观调控有效的信息技术支持,可以较好地弥补现有宏观调控理论的不足,从而完善房地产市场宏观调控理论。
(2)有利于建立系统的房地产信息引导和预警体系 作为未来房地产宏观调控理论的主导手段、现有宏观调控理论的信息支持手段,信息引导和预警体系的研究是非常重要的。房地产信心指数研究是其一个主要方面,将基于市场的供应和需求状况,反映消费者、开发商和政府对房地产市场的信心水平,从而较好地完善、丰富信息引导和预警理论,为宏观调控提供更强有力的支持。
(3)有利于房地产信心指数理论的研究,弥补国内在这方面的研究空白 房地产信心指数在国外研究较早,应用也较为广泛,但国内相关研究才刚刚起步。针对建立房地产信心指数的关键技术、数学模型等研究,将为在我国研究与建立房地产信心指数提供较好的参考价值,弥补国内在这方面的研究空白。同时,也可以推动国内外信心指数理论的研究与应用,完善信心指数理论的研究,并大大提高信心指数的应用水平和范围。
2.实际意义
(1)为政府及时把握市场需求提供可靠的参考依据,从而为政府科学的制定宏观调控政策奠定基础 房地产信心指数是对定期问卷调查和抽样调查得到的基础数据进行处理后而得出的综合指数和分项指数,能够及时地反映不同区域、不同收入水平消费者的需求偏好、对房地产价格水平的评价、对市场的预期、购房的目的、购房的影响因素等情况。通过对房地产信心指数的分析,政府可以对未来一段时间内房地产需求的规模和结构进行预测,在此基础上制定出具有前瞻性的政策。到目前为止,我国还没有任何其他手段来真实全面地反映房地产市场的需求状况,政策制定也是基于对过去宏观数据的分析,而不能完全针对消费者的未来需求偏好来制定政策。因此,开展对房地产信心指数的研究,可以填补此项空白,为政府制定政策提供更加科学、全面的参考依据。
(2)有利于政府做出科学合理的土地出让计划 土地供给是房地产市场的源头,而政府则是这一源头的提供者。科学合理的土地出让计划对于政府加强宏观调控,提高土地利用效率具有重要意义。然而,每一年应该向市场投放多少土地,应该出让哪些区域的土地,政府在制定计划时并没有一个相对科学的参考依据。比如前几年,由于土地供应量过大,导致大量的楼盘在随后的几年内涌现,最后造成供大于求,一方面造成大量的商品房空置,使开发商和金融系统面临极大的风险;另一方面也造成土地资源的严重浪费。通过建立房地产信心指数,政府能够对房地产市场上消费者信心水平有一个准确的衡量,能够对未来一段时期在某一区域内的消费需求做出客观预测。政府可根据房地产信心指数的情况,基于每年消费者的需求做出合理的土地出让计划,使土地资源发挥最大的效用。
(3)能够对区域规划及相关配套设施的建设起到良好的指导作用 城市规划与区域规划对城市的建设与发展具有显著的指引和导向作用,城市当前呈现出来的面貌正是前些年规划的结果。然而,一些城市的规划却远远滞后于经济发展的速度,并由此造成相关的城市问题(如交通堵塞)。例如,早期对于深圳市后来的人口总量预测在500万左右,而目前深圳市的人口近1000万。对人口的预测是城市规划的一个前提,由于认识上的不足,规划也由此出现相应的问题。造成问题出现的根本原因就在于对市场的发展没有足够地了解。就目前情况而言,政府规划应基于科学的市场调查,通过对市场的充分了解,在规划上则可做出相应的对策。房地产信心指数在编制时,就是依据对市场的充分了解,对市场已有了相对准确的测度。因此,由该指数反映出来的市场情况将为城市或区域规划提供较好的指导作用。
(4)对于政府旧城改造也将起到很大的帮助作用 旧城改造涉及到方方面面的关系和利益,而其中最重要的一点就是改造后该区域应该如何发展、如项目的选址、项目的定位、项目的风险、项目的投资回报等。要对这些做出正确的估计必然依赖于对市场的把握,这就要求在市民中进行抽样调查以获取基础数据,使市民的意愿得以客观地反映出来。房地产信心指数将提供这些基础数据,从而使旧城改造体现市民意愿。
(5)对房地产开发商和消费者的行为起到积极的引导作用,从而促使房地产市场持续健康发展 由于房地产市场本身存在的缺陷,特别是供给与需求在时间和区域上的不同一性,那么完全依赖市场来进行有效的信息传导是不太现实的。健全市场信息公开制度,加强舆论引导及市场监测,增强政策透明度,可以较好的影响开发商和消费者对未来的预期,从而影响供应和需求变化。房地产信心指数系统能够精确地反映每一个片区的房地产市场供求状况、未来价格走势及市场的发展趋势。通过定期的发布房地产信心指数,房地产开发商、消费者能在这些市场信息的引导下,对市场情况做出正确的判断,从而做出合理的投资决策和明智选择,减少或避免一哄而上和盲目投资等情况的发生,使房地产市场健康发展。
房地产信心指数的理论基础[1]
1.市场供求理论
市场是交换关系的总和。广义上的市场是无形的、无处不在的。有交易行为或意向的双方就是一个交换关系,一个个交换关系就是市场(Vernor,1995)。而交换的前提是交换双方有需求意向和供应能力。可以说,需求和供应是市场的两个基本问题,而供求平衡是每一个市场追求的理想状态。房地产市场同样是由一个个房产和地产的交换关系组成,其交换的前提也是交换双方要有需求意向和供应能力。因此,研究一个房地产市场通常就是研究其需求及供应情况。
房地产市场的需求与供应,即房屋及土地的需求量与供应量,既会影响开发商和消费者的决策行为,同时也会对政府宏观调控产生较大影响。在需求旺盛时,房价较高,开发商会加大投资,以提高房屋供应量,此时房价若在合理的范围内,消费者会继续进行购房行为,政府也会相应地加大土地供应量,否则消费者将减少购房,政府也会减少土地供应量;而在供应过剩时,价格下降,开发商会减少投资,以减少房屋供应量,政府则会考虑减少土地供应量。房地产产品不同于一般商品,其供求关系比较复杂,也比较难以控制。因此,通过研究影响房地产市场需求和供应的相关因素或指标,可以较好地分析房屋需求与供应的变化情况。
房地产信心指数作为一个反映房地产市场状况的指标,其研究必须基于房地产市场的需求及供应情况。这里将根据中国房地产市场自身的特点,从需求和供应两个方面进行研究如何建立房地产市场信心指数,并进行应用分析。需求和供应又可划分为有效需求、有效供应、潜在需求和潜在供应。由此所建立的房地产信心指数既立足于市场的目前状况,又放眼于市场的未来走势,从而可以较好地满足研究的目的和需要。
2.房地产周期波动理论
房地产行业具备行业周期性的特点,对国民经济的起落极为敏感,这已从国内外房地产市场实际情况得到了证实。这种周期性与市场经济的发达程度密切相关,市场经济越发达,周期性越明显。房地产周期波动理论是本信心指数研究前提和基础。
房地产周期波动可用冲击-传导模型来解释。冲击-传导模型常用于解释经济周期波动,即经济周期波动是经济体系受到随机性的外部冲击后,经由一定的内部传导机制而引发的周期性反应。房地产行业也是一个经济体系,因此可以用冲击-传导模型来解释,大致分为四个阶段。一是外部冲击阶段,即来自于房地产经济系统外部的变量,如宏观经济政策变动等,对房地产经济系统产生外部冲击;二是初始响应与内部传导阶段,即房地产经济系统对外部冲击产生初始响应,并利用内部传机制把外部冲击转化为房地产经济系统运行的重要动力因素;三是内部传导与振荡衰减阶段,即由于房地产经济系统存在内部运行阻力,当外部冲击通过内部传导机制向房地产系统各个领域进行全面传导时,必然会导致初始响应发生衰减,也就是随着内部传导过程的持续,外部冲击对房地产经济系统运行路径的影响程度会逐渐衰减,表现为房地产经济波动在强度、振幅与波长等指标上逐渐趋于正常或稳定状态;四是进入稳定状态阶段;即房地产经济系统在对外部冲击作出初始响应,并经内部传导机制作用而呈现振荡衰减之后,到达一定时刻后重新进入稳定状态,或重新回到外部冲击前的正常运行轨迹。
外部冲击和内部传导对房地产经济周期波动的运行机制和影响效果有所区别。一般来说,从运行机制来看,外部冲击来源于外生变量的自发性转移,主要强调时间序列的变化,通过外生变量及与内生变量无关的参数体现出来,并通过这些变量的传导作用对房地产经济波动产生影响;内部传导机制反映了房地产经济系统的结构效应,主要通过与内生变量相联系的结构参数体现出来,强调房地产经济系统对外生的时间序列变量变化的滞后响应,因此内部传导机制主要通过房地产经济系统的内在机制而在系统内部扩散,表现为系统内部对于外部冲击的自我响应与自我调整。从对房地产经济波动的影响效果来看,外部冲击是波动的初始原因或初始推动力量,并不直接决定房地产波动的周期性和持续性,只是通过内部传导机制对周期波动的波幅、波长、波峰、波谷等产生叠加影响,使基本波动形态产生变化,并对房地产周期波动转折点的形成产生主导性作用;内部传导机制虽然表现为对外部冲击的滞后响应,但由于房地产经济系统是一个内生运动决定的单一积累过程,因而在本质上决定着房地产经济波动的周期性和周期的持续性,决定着房地产周期波动过程中包括波峰、波谷、波幅、波长等基本波动形态。
由冲击-传导理论可知,房地产周期波动受外部因素和内部因素同时作用,而外因是原动力,内因则是决定周期波动强度的主导因素。房地产信心指数研究就是充分地将房地产市场内部因素和外部因素结合起来,以单个因素和综合因素的形式来反映房地产市场的变化趋势。信心指数的指导性和预测性,正是基于周期波动理论来实施的。因此,房地产周期波动理论既是信心指数研究的基础,又是信心指数应用的前提。
房地产信心指数的技术框架[1]
由图1可以看出,信心指数大体上包括三个部分,即反映有效需求及供应的单项指标V1、反映潜在需求的单项指标V2、反映潜在供应的单项指标V3以及合成V1、V2和V3后产生的反映整个房地产市场状况的综合指标V。
(1)房地产有效需求及供应。所谓市场有效需求及供应就是有支付能力或购买力的需求及相对应的供应(Colwell, et al, 1983)。房地产市场的有效需求及供应则是指在一个个关于房产、土地的交换关系中有支付能力的需求及相对应的供应。由于涉及房产或土地交换的关系数目众多,也就是说构成房地产市场的成分十分复杂,影响房地产市场有效需求及供应的因素众多、复杂多变,因此很难对其进行定性和定量分析。欲建立反映市场有效需求及供应的单项指标(V1),其前提是首先确定影响市场的有效因素,然后才能进行相关的计算。拟通过专家打分法及因子分析法来确定影响市场有效需求及供应的主要因素并计算各自的权重。在此前提下,基于相关调查数据,运用相关技术方法分析已确定的主要影响因素。
(2)房地产潜在需求。房地产潜在需求主要反映社会(主要包括大众)对房地产市场的预期。因此,建立潜在需求指数(V2),主要通过问卷调查、电话调查等方式收集非房地产从业者对房地产市场的观点和看法,然后分析他们对本地房市的期望和投资信心及其变化情况。
(3)房地产市场的潜在供应能力。房地产市场的潜在供应能力主要由所能开发的土地面积决定。由于土地资源是有限的,因此政府主管部门每年对土地的开发量和具体类别都有着严格的限定。一般情况下,政府相关主管部门每年都会制订新的土地开发政策,以保证辖区内的土地资源能被合理、科学的利用。同时,房地产市场的潜在供能力还受规划容积率的影响。由于容积率直接关系到单位土地面积的房屋开发量,因此容积率也是影响房屋潜在供应的一个重要因素。潜在供应指数(V3)的建立主要依靠政府的土地规划数据和市场开发数据。
房地产信心指数体系的建立[1]
根据房地产信心指数的技术框架从纵、横两个构建中国房地产信心指数体系。
1.从纵向角度建立的房地产信心指数体系
从纵向角度建立的房地产信心指数体系如图2所示。由图2可以看出,房地产信心指数分为四层:第一层是综合信心指数层,其主要从宏观角度综合反映某个区域房地产市场发展的现状与趋势;第二层是单项指数层,分别从有效需求及供应、潜在需求和潜在供应三方面反映房地产市场的发展情况;第三层是分项指数层,其从具体指数出发,建立可以反映有效需求及供应、潜在需求和潜在供应等指数的分项指数;第四层是基础指数层,其主要是针对分项指数层可以进一步细化的指数进行再分析,从而确定常常可以引起民众及专家注意的指数。
2.从横向角度建立的房地产信心指数体系
从横向角度建立的房地产信心指数体系如图3所示。无论是综合信心指数,还是单项信心指数或者其他级别的指数,都既可以对整个城市乃至全国房地产市场进行分析,又可以对某个地区或行政区的房地产市场进行分析,建立其信心指数。房地产信心指数的功能分析[1]
房地产信心指数对房地产市场的发展可以起到较好的引导作用,引导投资、引导消费及辅助政府对房地产市场宏观调控等,下面将对其具体功能进行分析。
1.综合信心指数
综合信心指数是将有效需求及供应、潜在需求和潜在供应等因素综合考虑,进而整体反映一个地区房地产市场发展现状及未来趋势的指标。它是衡量一个地区房地产市场前景是否乐观、是否健康的一个重要手段。政府、投资者及消费者可以通过综合信心指数从整体上把握房地产市场的走向,为宏观调控及投资决策把握方向。综合信心指数在整个房地产信心指数体系中,起到了宏观导向作用。
2.有效需求及供应指数
有效需求及供应指数主要是考虑影响当前房地产市场需求及供应的因素,如价格、人口等,通过这些因素反映当前房地产市场的实际需求和供应情况及趋势。政府、投资者及消费者可以基于此指数了解房地产市场的供需现状,为制定房地产相关政策及投资和消费提供参考。另外,该指数还为综合指数的建立提供相关数据支持。
3.潜在需求指数
潜在需求指数是通过调查统计分析,了解消费者对未来房地产市场所持的态度,从而可以分析未来一段时期内社会对房地产产品的需求状况。该指数不仅可以为房地产开发商投资决策提供有效的信息,而且还可以为消费者的购房计划提供有价值的参考数据,为政府制定土地规划及建设规划提供相关信息。同时,其也为综合信心指数的建立提供相关数据。
4.潜在供应指数
潜在供应指数是通过对城市规划及行业规划数据的分析,而确定反映未来一段时期内房地产市场供应水平的指标。房地产供应水平不仅会影响房地产开发商未来的开发决策,而且会影响消费者的购房计划。从侧面也反映了房地产开发量是否将保持一个持续增长的水平,这关系到房地产市场产品的增存量及政府对房地产市场调控走向。同样,其也为综合信心指数的建立提供数据支持。
5.其他指数
其他次级指数都从更为微观的角度反映房地产市场的发展状况。如价格指数,其可以反映新开发住宅市场的价格现状及未来趋势,这可为购房者提供较好的参考依据。同时,这些指数又为上一层指数提供基础数据支持。
房地产信心指数的关键技术[1]
房地产信心指数在我国房地产市场的研究和应用才刚刚起步,还没有形成较为系统的方法和技术。尽管国外房地产信心指数的研究可以为我国建立房地产信心指数提供相关参考方法,但是房地产市场具有很强的地域性,尤其是我国房地产市场还不够成熟,因此必须根据我国房地产市场实际情况研究相关方法和技术。
房地产信心指数关系到供应和需求的定量数据,也涉及到其定性数据。对于定量数据,大部分可以通过实际调研直接获得,如房屋销售数据等;而对于大部分定性数据,如人们的住房需求偏好、购房欲望、开发商的投资热情、影响房地产需求因素的重要性等等,都难以直接获得,这就必须借助于调查问卷法来实施。
调查问卷法是一种广泛应用于信息收集(包括定量和定性信息,特别是定性信息)的重要手段。应用调查问卷法的重点是设计调查问卷,调查问卷设计的好坏直接关系到调查问卷法应用的成功与否。问卷是一连串有系统、有顺序且有目的的问题组合,其应该包含所有项目。因此,在设计房地产信心指数相关调查问卷时,必须坚持以下原则:
(1)避免一般性或不具体的问题;
(2)用字简单、定义清楚,问题用字要力求口语化;
(3)避免用多语意字;
(4)避免用含糊不清的句子;
(5)避免用引导性问题;
(6)针对困窘性问题,采用迂回方式设置;
(7)避免断定性问题;
(8)避免假设性问题;
(9)保证问题逻辑一致性和内容完整性。
在研究和分析房地产信心指数的过程中,需要建立指标体系,确定相关指标,如影响房地产市场有效需求及供应的指标。由于房地产相关影响因素较多,在建立这些指标过程中,为了简化计算,就要尽可能地用较少量的指标来描述和分析所要解决的问题;另外,在建立指标时,不可避免地某些指标之间会存在或大或小的相关性,对于相关性较大的指标,应给予剔除。因此,可以说在房地产信心指数研究及建立过程中,因子分析法是一种不可或缺的方法。
2.1 因子分析法的原理
在20世纪初,为了分析智力测试的结果,英国心理学家Charles Spearman(Gorsuch, 1983)[133]建立了因子分析法。之后,因子分析法作为一种统计数学计算工具被广泛应用于化学、社会学、经济学、心理学等各个领域,甚至于用来预测赛马结果(Reese, Lochmuller, 1993)。通常情况下,许多统计学方法是用来研究自变量与因变量之间的关系;因子分析法则有所不同,它是用来研究许多自变量之间的关系模式,从而发现影响因变量的因素的性质(即使这些因变量是不能直接测量的),而这些推导出的因变量则被称之为因子。典型的因子分析法一般会提出四个方面的问题:1)有多少不同的因子用于解释变量之间的关系模式;2)这些因子的性质;3)如何更好地用假设因子解释观测数据;4)每一个被观测的变量包括多少随机性或唯一性(Rubenstein, 1986)。与传统的统计学方法相比,因子分析法的优势在于能够提供一个有代表性的关系矩阵,而其他的统计学方法只能提供一个显示相似特性的矩阵。从数理统计的角度来看,因子分析的基本目的是用少数几个随机变量去描述许多变量之间的协方差关系。与多元回归不同的是,这里的少数几个随机变量是不可观测的,通常称之为因子。本质上,因子分析基于这样的思想:根据相关性的大小将变量分组,使得同组内的变量之间相关性较高,但不同组的变量相关性较低。由此可以认为,每组变量代表一个基本结构(因子),它们可以反映问题的一个方面,或者说一个维度。
2.2 因子分析法的步骤
采用因子分析法进行影响因素分析时,要遵循以下七个步骤。
(1)定义问题这包括定义一个因子分析的问题,如房地产市场有效需求及供应问题,并确定实施因子分析的变量。
(2)计算并检验相关关系矩阵包含在因子分析中的变量必须具有一定的相关性,这可以进行直观判定,也可以通过客观的检验方法来确定,如巴特利特球体检验、KMO测度等。
(3)选择因子分析的方法主成份分析法和公因子分析法是两种主要的寻找因子的方法。主成分分析法是一种值得推荐的方法,同时也是一种应用比较广泛的方法。
(4)确定因子数目 主成分分析法所获得的因子解的数目同原来变量的个数是一样的,而因子分析的主要目的则是用少数几个公因子来阐释数据的基本结构,因此要进行因子选择。除了经验判断外,特征值法是应用较多的判断方法,其要求保留因子特征值大于1的那些因子。另一个常用方法是基于所保留的因子能够解释的方差比例。一般而言,所保留的公因子至少应该能够解释所有变量60%的方差。另外,因子碎石图(Scree plot)、半分法及统计检验法也是确定因子数目的有效方法。
(5)因子旋转因子荷载给出了观测变量与提取因子之间相关程度的大小,这意味着在某一因子上荷载大的变量对该因子的影响较大。但是,基于公因子本身的意义,实际中往往会出现所有变量在一个因子上的荷载都比较大的情形,这为因子解释带来了困难。因子旋转的目的就是使某些变量在某个因子上的荷载较高,而在其他因子上的荷载则显著低。正交旋转(Orthogonal rotation)和斜交旋转(Oblique rotation)是因子旋转的两种方法。如果总体上各因子间存在明显的相关关系,则应该考虑斜交旋转。
(6)因子解释因子分析的重要一步是对所提取的公因子给出合理的解释。因子解释可以通过考虑在因子上具有较高荷载的变量的意义来进行。经过因子旋转后的因子荷载阵可以大大提高因子的可解释性。需要注意的是,即使经过因子旋转后,仍有可能存在一个因子上的所有荷载均较高的情形,这种因子通常可以称之为一般(或者基础性)因子。一个合理的解释是,它是由所研究问题的共性决定的,而不是单一地取决于问题的某一个方面。此外,对于某些荷载较小、难以解释或者实际意义不合理的因子,如果其解释的方差较小,则通常予以舍弃。
(7)因子得分若需要后续分析,如进行回归分析等,通常需要进一步计算各公因子的因子得分,即给出各因子在每一个案例(Case)上的值。事实上,既然各观测变量可以表示为各公因子的线性组合,那么反之,各公因子也可以表示为各观测变量的线性组合,见式(1):式中 Fi——第i个因子的得分;
Xm——第m个观测变量值;
Wim——第i个因子在第m个观测变量上的因子得分系数。
因子得分正是通过这样的方法,利用各观测变量的值而估计得到的。主成分分析法可以给出各因子的得分,并且这些值之间是不相关的。因子得分值可以用来代替原来的变量用于后续分析。由于消除了相关性,为后续统计分析方法的应用提供了较大便利。
因子分析法主要应用于确定影响房地产市场有效需求及供应的相关指标。
在房地产信心指数合成时,如综合信心指数的合成,这里欲采用综合指数法(即加权平均法),这需要确定各次级指数的权重。有些指数的权重属于定性问题,直接采用定量分析方法很难确定,故需要采用一种方法对各指数的相对重要性进行量化处理。针对这样的情况,德尔菲法则是比较适用的一种方法。
3.1 德尔菲法的原理
德尔菲法也称专家打分法,最早产生于20世纪50年代末,是当时美国为了预测在其“遭受原子弹轰炸后,可能出现的结果”而发明的一种方法。1964年美国兰德公司的Helmer和Gordon发表了“长远预测研究报告”,首次将专家打分法应用于技术预测,以后便迅速应用于美国和其他国家。除了科技领域外,它还几乎可以用于任何领域的预测,如军事预测、人口预测、医疗保健预测、经营和需求预测、教育预测等。此外,它还用来进行评价、决策和规划,并且在长远规划者和决策者心目中享有很高的威望(Morrison, 1990)。据《未来》杂志报导,从上世纪60年代末到70年代中,专家打分法在各类预测方法中所占比重由20.8%增加到24.2%。在我国,自从80年代以来,不少单位也采用专家打分法进行了预测、决策分析和编制规划工作。专家打分法本质上是一种反馈匿名函询法,其过程是,在对所要预测的问题征得专家意见之后,进行整理、归纳、统计,再匿名反馈给各专家,再次征求意见,再集中,再反馈,直至得到正确的意见,如图4所示。3.2 德尔菲法的步骤
该方法主要应用于建立综合信心指数、房地产市场有效需求及供应指数、潜在需求指数等。通过房地产业内专家对各指标的打分,进行分析-反馈,最终得到比较一致的、可以反映房地产市场综合信心指数的相关单项指数的权重。下面以房地产综合信心指数为例,说明如何采用德尔菲法确定其次级指数(有效需求及供应指数、潜在需求指数和潜在供应指数)的权重。由于不同地区或行政区三个指数的权重不同,在此仅以深圳市级的指数为例确定各指数的权重。应用德尔菲法确定单项指数权重的操作步骤如下:
(1)确定专家组成员 由于研究的是房地产信心指数,所以应在房地产领域及宏观经济领域选择专家。
(2)介绍基本情况 向专家组介绍并发放问题相关资料,并回答专家组的疑问。
(3)制定并发放专家评价表 如表1所示,其总分为100分,各单项指数取值在100分以内。
表1 专家评价打分表
综合指数 | 房地产综合信心指数 | ||
影响因素 | 有效需求及供应指数 | 潜在需求指数 | 潜在供应指数 |
因素得分值(%) | P1j | P2j | P3j |
(4)收集并整理专家意见 根据整理结果将意见反馈给各位专家,为他们对自己的判断做参考。
(5)结果汇总 经过三到四轮的发放与整理专家意见后,对最后结果进行汇总。采用简单平均法计算得分值(即权重),见式(2):式中 Wi——第i个指数的得分值(权重);
Pij——第j个专家对第i个指数的打分值;
n——专家总数。
基于上述方法,确立深圳市房地产信心指数的各单项指数权重,如表2-2所示。
表2 深圳市房地产信心指数权重表
综合指数 | 深圳市房地产综合信心指数 | ||
单项指数 | 有效需求及供应指数 | 潜在需求指数 | 潜在供应指数 |
权重值(%) | W1 | W2 | W3 |
消费者潜在需求指数是房地产信心指数的重要组成部分,采用适当的方法对其进行分析是十分必要的。消费者情绪指数法(ICS)在消费者心理需求研究及应用方面得到了较好地发展,目前趋于成熟。这里欲采用消费者情绪指数法建立房地产市场潜在需求指数。
4.1 ICS的原理
Michigan大学的消费者情绪指数(ICS)是一个建立在跨度超过50年期的调查(Curtin, 2000)基础上的指数,ICS方法由其负责人Richard Curtin(2002a)作了详细描述。事实上,每月有一个月度调查,该调查是建立在对生活在一起的美国(包括48个州和哥伦比亚特区)家庭成年男女进行的大约500个电话采访基础上,通过五个问题建立消费者情绪指数。按照Curtin的解释(2002b),“两个问题集中在家庭的财务状况近来如何发生变化和前些年间期望如何发生变化,两个问题集中在近期或更长期的经济前景,另一个问题集中在住房的购买能力。”
之后,这一方法被应用到房地产领域用以建立能反映消费者需求的指数。在美国,Texas A&M 大学的房地产中心编制的Texas房地产指数(TRECI),在原理上采用了与ICS同样的方法。但是,在这里存在着五组专家:建设者、商业性房地产经纪人、住宅房地产经纪人、抵押借贷人和商业借贷人。这样,这些小组涉及到了不动产发展、建设和金融领域。每一个专家被问及六个问题:前三个问题涉及到他们对前一季度的评估,后三个问题集中在对下一个季度的预期。同样,在中国香港,香港理工大学房地产研究中心编制的BRE指数,在原理上也是基于ICS方法,对设定人群的随机性电话跟踪调查,该调查建立在大概二十个不同的问题上。通过对答案的整理和分类,基本上能够确定出房地产市场中各相关因素及影响和消费者对于整个市场的看法。
4.2 基于ICS的指数分析步骤
由于中国大陆房地产市场同国外及香港等地区的房地产市场比起来存在较大差异,且还不够成熟,因此在采用消费者情绪指数法之前应结合我国房地产市场的实际情况进行改进,相关应用分析步聚如下:
(1)设计调查问卷 根据中国大陆房地产市场实际状况,有针对性的设计调查问卷,同时设计对外开放网站,以便通过多种渠道、在多种场合进行问卷的发放与回收;
(2)问卷统计分析 根据信心指数设计的需要,对调查问卷进行统计分析,计算针对不同人群的潜在需求指数,并确定相应的权重;
(3)确定潜在需求指数 通过加权平均法合成各分项指数,从而确定综合潜在需求指数。
在房地产信心指数研究过程中,将建立一个指数体系,显现阶梯型指数分布,因此需要指数合成,如合成价格指数、房地产有效需求及供应指数、房地产潜在供应指数及房地产综合指数等。由此可见,综合指数法在房地产信心指数建立过程中是必需的一种方法。
综合指数法是一种常用的综合评价或分析方法,也是一种典型的定量分析方法。它的思想是把各评价指标的统计分析数值进行加权计算,确定一个综合值用来评价方案优劣。该方法的优点是显而易见的,操作简便,同时综合考虑了多个指标。但是,确定各指标的权重是该方法需要面对的重要问题。
众所周知,股票市场的技术指标系统是较为成熟和完善的,股市技术指标系统所运用的数量分析方法对于原始数据未来走势预测的准确程度已经得到较大认可,并已开始应用于期货市场和货币金融市场。对于房地产信心指数,其预测分析是房地产信心指数研究的需要内容。由于房地产市场与股票市场在某种程度上的相似性,这里欲采用股票模拟技术进行信心指数的预测分析。
6.1 房市与股市的相似性
(1)二者都与宏观经济形势息息相关,且与宏观经济形势呈正相关。
(2)二者都存在信息不对称现象 股市中的信息不对称现象比比皆是,造成庄家肆意操纵股市,还被冠以“先知先觉者”的美称,结果是广大股民套牢,为庄家作嫁衣。房市中也存在类似现象。在房屋买卖中,买家常常处于弱势。楼盘好比是开发商的子女,楼盘的成长历程为开发商所熟悉。从土地选址、规划报批、建设、销售直至物业管理,开发商倾注了大量的心血。房屋质量、小区环境、小区周边配套设施及未来若干年内的规划,开发商心知肚明。
(3)在两个市场中都有“国有股” 股市中存在国有股,这一点为众人所知。而房市中的“国有股”是指公房、房改房、机关与事业单位的自建房以及法律不允许转让的花园别墅与部队用房等。这些“国有股”的存在,使得房价整体偏高,未反映出市场的真实情况。
房市与股市的相似性,使得股标模拟技术在房地产信心指数预测中的应用成为可能。
6.2 指标模拟法的原理
指标模拟就是模拟股票市场技术指标体系,将股票市场走势预测计算方法运用到房地产走势预测上。指标模拟技术全部来源于股票市场。股票理论有两个基本的派别:随机漫步理论和技术分析理论。随机漫步理论的基本观点是,股票价格的波动完全是无序的,因而是完全不可测的,唯一可做的就是找出股票市场的趋势并顺应它;技术分析派认为股票价格的波动呈现某种规律性,是可测的(Hebner, 1964)。两个派别都存在着一定的局限性,随机漫步理论是以股市发展趋势为研究对象,认为只要把握了趋势,买什么股票是不重要的,最著名的例子是“乱扎飞镖”。在实际应用中,如“数人头理论”、“反向操作”,都是随机漫步理论的应用方法(Fama,1970)。技术分析派则是以具体走势为研究对象,通过技术分析,才能找到具体的买卖位置。在20世纪30年代以前,整个世界的股票市场都被分为随机和分析两派,或只把握股市的趋势,而无法对某一时间段的走势做出判断;或只分析具体股票走势,而无法对市场整体走势做出判断。美国学者艾略特于1938年创立的波浪理论,从另一个层面揭示了事态发展的过程,并能体现出独特的价值和判断功效。波浪理论将随机漫步理论和技术分析理论巧妙的融合在一起,能够从整个市场的趋势和具体股票走势两方面分析。
6.3 指标模拟法的类型
股市指标体系是一个十分复杂的技术体系,所包括的技术指标数量众多,各自的定义及表达内容也不相同。但大多数技术指标都是由下列三种指标衍生而来的。
(1)移动平均线(MA) 作为一种技术分析指标,移动平均线在股票市场中应用最为广泛并最具灵活性。1939年,美国投资分析家加利特第一次开创性地对移动平均线做出分析(Gau, Kohlhepp, 1978)。移动平均线是一种追踪市场趋势的有效工具,目的在于识别旧趋势已终结、新趋势萌生的关键契机,是用统计处理的方式将若干天的股票价格加以平均,然后连接成一条线,用以观察股价趋势。移动平均线的理论基础是道琼斯的“平均成平”概念。移动平均线通常使用周期有3日、6日、10日、12日、24日、30日、72日、200日、288日、13周、26周、52周等,不一而足,其目的在于取得某一段时间的平均成本,而以此平均成本的移动曲线配合每日收盘价的线路变化分析某一期间多空的优劣形势,以研判股价的可能变化。一般来说,现行价格在平均价之上,意味着市场买力(需求)较大,行情看好;反之,行情价在平均价之下,则意味着供过于求,卖方压力显然较重,行情看淡。移动平均的期间长短关系其敏感度,期间愈短敏感度愈高,一般股价分析者,通常以6、10日移动平均线观察短期走势,以10日、20日移动平均线观察中短期走势,以30日、72日移动平均线观察中期走势,以13周、20周移动平均线观察长期走势。西方投资机构非常看重200天长期移动平均线,以此作为长期投资的依据,行情价格若在长期移动平均线下,属空头市场;反之,则为多头市场。
MA的计算公式,见式(3):式中 Pn——第n日平均价;
n——天数。
(2)平滑异同移动平均线指标(MACD) 平滑异同移动平均线是由查拉尔·阿佩所创造的,是一种研判股票买卖时机,跟踪股价运行趋势的技术分析工具。MACD指标是根据MA的构造原理,对股票价格的收盘价进行平滑处理,求出算术平均值后再进行计算,是一种趋势指标。MACD指标是运用快速(短期)和慢速(长期)移动平均线及其聚合与分离的征兆,加以双重平滑运算。而根据移动平均线原理发展出来的MACD,一则去除了移动平均线频繁发出假信号的缺陷,二则保留了移动平均线的效果。因此,MACD指标具有均线趋势性、稳重性、安定性等特点,是用来研判买卖股票时机,预测股票价格涨跌的技术分析指标。MACD指标主要是通过EMA、DIF和DEA(或MACD、DEM)三值之间关系的研判、DIF和DEA连接起来的移动平均线的研判以及DIF减去DEM值而绘制成的柱状图(BAR)的研判等来分析判断行情,是预测股价中短期趋势的主要技术指标。其中,DIF是核心,DEA是辅助。DIF是快速平滑移动平均线(EMA1)和慢速平滑移动平均线(EMA2)的差。BAR柱状图在股市技术软件上是用红柱和绿柱的收缩来研判行情。MACD在应用时,首先计算出快速移动平均线(即EMA1)和慢速移动平均线(即EMA2),以此两个数值,作为测量两者(快慢速线)离差值(DIF)的依据,然后再求DIF的N周期平滑移动平均线DEA(也叫MACD、DEM)线。如图5为某个股的MACD图。以EMA1的参数为I日,EMA2的参数为J日,DIF的参数为K日,来分析MACD的计算过程:
①计算移动平均值(EMA)
EMA(I)=前一日EMA(I)×(I-2)/(I+1)+今日收盘价×2/(I+1) (4)
EMA(J)=前一日EMA(J)×(J-2)/(J+1)+今日收盘价×2/(J+1) (5)
②计算离差值(DIF)
DIF=今日EMA(I)-今日EMA(J) (6)
③计算MACD
MACD=前一日DIF(K)×(K-2)/(K+1)+今日DIF×2/(K+1) (7)
(3)偏离率(BIAS) 偏离率(亦称乖离率,从计算原理上看,称偏离率是比较准确的)是运用股价指数与移动平均值的比值关系,观测股价偏离移动平均线的程度,以此决定投资者的行为。计算公式见式(8):
偏离率=(当日股市收市价-N日移动平均值)/N日移动平均值*100% (8)
一般来讲,BIAS偏离移动平均线的界定范围大体在-15%至15%,即当BIAS在0-15%之间时,股票价格可能下跌,当BIAS在-15%至0之间时,股票价格可能上涨。
6.4 房市与股市的区别
尽管房市与股市存在一定的相似性,但是二者之间还是存在一定的区别。
(1)不同的资产属性和地位 股票代表着虚拟经济,是纸上富贵,落袋方能为安;房地产则是实业。房地产所具有的不可移动性、独一无二性;股票都不具备。房地产具有难以变现性;股票则属于速动资产,可随时变现。房地产具有保值增值功能。对房地产本身进行投资改良、通货膨胀、需求增加导致稀缺性增加、外部经济或相互影响,都会引起房地产价格上升。股票却不具备这方面的功能。
(2)不同的获利方式 股票的获利方式有两种,谋求差价和获取红利;房地产的获利方式有三种,谋取差价、获得租金与自住。
(3)不同的周期 房地产周期长于股市的周期。
(4)二者虽然同时存在信息不对称和国有股现象,但股市中的不对称现象和国有股较楼市严重 例如在房市中获取土地须通过拍卖方式取得,小区物业管理须通过招投标方式获得,房屋销售时必须公开价格,一房一价。因此即使房市中有不对称现象存在,也不会很严重;而在股市中,国有股、法人股所占比例大,远远超过了50%,尽管房市中亦存在“国有股”,但所占比例较小。
(5)运作股票与运作房地产的难度与方式也完全不一样 房地产开发一般需经历投资机会寻找、投资机会筛选、可行性研究、获取土地使用权、规划设计与方案报批、签署有关合作协议、施工建设与竣工验收、营销与物业管理等步骤。运作房地产的难度远大于股票。
6.5 问题分析
通过上述对房市与股市的比较可以看出,二者的相似性为指标模拟法应用于房地产市场提供了前提条件,但是它们之前同时存在着较大的区别,因此指标模拟法不可以简单地直接应用于房市,需要注意以下几方面的问题:
(1)数据来源的精确性和及时性 股市指标系统所需的数据是来自证券交易所,由于证券交易所是正式、公开且唯一的股票交易场所,因此精确性和及时性是勿庸置疑的,以现在的深圳、上海两地交易所为例,两地交易所均能提供精确到分钟的即时交易信息,这就为指标系统的建立打下了坚实的基础;相反,房地产市场由于尚未有如同证券交易所这样一个公开、唯一的交易场所,因此交易信息的搜集和整理都存在一定的难度,通常数据搜集都是通过有关部门对所辖区域内一级市场的开发情况、二级市场开发商上报的交易情况以及三级市场二手房交易情况的整理得出并发布,但由于透明度不够,开发商出于自身利益的考虑,所提供的信息都有所保留。因此,如果要将指标模拟法应用于房地产市场,支持指标系统运行所需数据的精确性和及时性能否得到保证是需要解决的第一个问题。
(2)指标研究对象的选取 股票交易市场本质决定了股市指标系统的唯一对象只能是股票价格,由于对象是唯一的,相对来说,指标模拟法的应用具有一定的局限性。房地产市场则恰恰相反,影响房市的因素数量众多且各不相同,价格只是其中之一,在应用指标模拟法时,如果单单以价格为对象建立指标,无法全面反映房地产市场的情况。在运用指标模拟法时,是以单个影响房地产市场的因素为对象,还是多个因素为对象以及影响因素的选取等等都是需要解决的问题。
(3)指标系统研究对象的时效性和延续性 股市指标系统是对上市交易的个股走势进行分析,通常情况下,上市公司的股票交易是会一直持续下去的,也就是说只要还是上市公司,股票的交易就不会停止,从这个意义上来说,股市指标系统对于目标的分析可以一直延续下去;房地产市场则不同,在房地产市场中,一个楼盘就相当于股票市场中的一支个股,房产开发商建楼的目的就是售出赚取差价,当整个楼盘已经全部售出时,对于这个楼盘来说,自身在二级市场的交易已经完成,接下去的交易也就相应的在三级市场完成。如果对于房地产市场的研究主要集中在二级市场上,也就是说对各楼盘交易情况的分析主要是其在二级市场上的状况,那么当指标模拟法应用到房地产市场时,它的研究对象就具有了时效性,只能对其在一段时间内进行分析,当研究对象在二级市场的交易结束时,对它的分析也就基本结束。
6.6 指标模拟法改进
基于上述问题分析,将指标模拟法应用于房地产市场之前,应根据房地产市场的实际情况对指标模拟法进行改进,主要有以下两点:
(1)针对影响房地产市场的多个因素建立指标模拟方法 在建立房地产信心指数时,不仅仅涉及到房地产的价格,还涉及到人口、土地等多种因素,因此在房地产信心指数的模拟预测分析时应该考虑多个因素的指数模拟。
(2)根据各因素的不同情况,对分析周期进行调整 房地产相关因素比较复杂,统计周期较长,不象股票市场每日为周期进行统计,因此在用指标模拟法进行指标模拟时,要根据各因素的不同情况,采用不同的统计周期进行分析。如房地产销售价格统计时,可以采用以月为周期进行统计。
房地产信心指数预测是信心指数研究与应用的重要内容,通过对未来市场的预测,可以较好地引导整个房地产市场供求变化,从而保证市场健康发展。但是,由于房地产信心指数的发展趋势一般为非线性,同时不同级别的指数发趋势又不相同,如价格指数、人口指数等,故单纯地采用指数模拟法不一定能够满足指数预测的需要。神经网络法的一个突出优点就是可以解决非连续性、非线性的预测问题,因此将神经网络技术引入到房地产信心指数预测中来,可以较好地达到预测目的。
7.1 神经网络法的原理
“人工神经网络”(Artificial Neural Networks,简称ANN)是在对人脑组织结构和运行机智的认识、理解基础之上,模拟其结构和智能行为的一种工程系统。1943年,神经生物学家McCulloch和青年数学家Pitts共同提出了第一个人工神经元模型,并在此基础上抽象出神经元的数理模型,开创了神经网络的研究。其后,Rosenblatt、Widrow 和 Hopf、Hopfield 等学者又先后提出了感知模型,使得人工神经网络技术得以蓬勃发展。
人工神经网络基本模型有MP模型、感知器模型、自适应性神经元等。若按神经元之间的联接方式,大体上可分为四大类,即前向型、反馈型、随机型和自组织竞争型。到目前为止,研究和应用最多的是多层前向网络。多层前向网络需要解决的关键问题就是学习算法,而以Rumalhart和McCllland为首的科研小组提出的误差反传算法,即BP(Backpropagation)算法,为多层神经网络的研究奠定了基础。很多学者已经从理论上证明了,三层前向神经网络(如图6所示)可以以任意精度逼近任意连续函数,这为神经网络的推广应用提供了前提保证。但是BP算法存在以下缺陷:由于该算法采用误差导数指导学习过程,从本质上来说是属于局部寻优法。在存在较多局部极小点的情况下容易陷入局部极小点,且不可避免地存在着学习速度与精度之间的矛盾。当学习速度较快时,学习过程容易产生振荡,难以得到精确的结果。而当学习速度较慢时,虽然结果可以得到较高的精度,但学习周期太长,也不实用。另外,由于BP神经网络学习算法是一种依赖于经验的启发式技术,利用梯度下降法调节权值使目标函数达到极小,而目标函数仅为各给定输入和相应输出差的平方和,导致了BP网络过分强调学习错误而泛化能力不强。同时,神经网络的学习算法采用经验风险最小化原理(Empirical risk minimization,ERM),不能使期望风险最小化,在理论上存在缺陷。尤其在小样本情况下,容易出现过学习(Over-Fitting),从而导致泛化能力低下;另外,神经网络算法的复杂性受网络结构复杂性和样本复杂性的影响较大。针对这些问题,国内外学者进行了大量研究,已取得了一定的研究成果,如将遗传算法(Genetic Algorithm,GA)引入到训练中来。在预测房地产信心指数时,房地产信心指数研究将在大样本的情况下,采用加速训练法,如Levenberg-Marquardt(LM)训练规则,进行训练,并进行模拟分析。近几年来,随着计算机技术的飞速发展,人工神经网络技术也得到了长足的发展。其独特的信息处理特点使其在模式识别、工业控制、图象处理等许多领域得到了成功的应用。它不仅具有强大的非线性映射能力,可以实现任何复杂的因果关系,而且还具有许多优秀特性,如:自适应、自学习和高容错性等,它能够从大量的历史数据中进行聚类和学习,进而找到某些行为变化的规律。神经网络的这些特性吸引了技术分析者们的目光。
7.2 神经网络法的步骤
基于神经网络法进行指数的预测分析,主要遵循以下步骤:
(1)确定神经网络的层数 根据不同类、不同级别的指数特点,确定神经网络的层数、各层的元素数及输入向量的元素数;
(2)确定训练数据集和测试数据集 一般采用一段时间的信心指数集为训练数据集,而采用下一段时间内信心指数集为测试数据集;
(3)进行训练和测试 基于数据集和测试集进行网络的训练和测试;
(4)基于网络的指数预测 根据训练成熟的网络进行指数的预测与分析。另外,需要有一个前提条件,就是尽可能在大样本量的情况下采用BP网络。
在指数建立初期,由于数据量较少,采用指标模拟法和神经网络法进行预测有可能达不到应有的效果。而支持向量机法则被认为是解决小样本数据预测的较好的方法。
8.1 支持向量机法的原理
机器学习是继专家系统之后人工智能的又一重要领域,很多学者都认为学习是智能的核心。基于数据的机器学习(Learning from examples)是现代机器学习技术中的重要方面,它从观测数据(样本)出发去寻找规律、发现模式,并利用这些规律和模式对未来数据或无法观测的数据进行预测和分类。
支持向量机(Support Vector Machine,SVM)是数据挖掘的一项新技术,是借助于最优化方法解决机器学习问题的新工具,是上世纪90年代中期提出的一种机器学习算法,它具有完备的基础——Vapnik创建的统计学习理论,和出色的学习性能。传统的学习方法(如神经网络)采用经验风险最小化(ERM)准则,在训练中最小化样本点误差,因而不可避免地出现过拟合现象,这样模型的泛化能力受到了限制。而统计学习理论采用结构风险最小化(Structural Risk Minimization,SRM)准则,在最小化样本点误差的同时,缩小模型泛化误差的上界,即最小化模型的结构风险,这样它同时最小化经验风险和VC维的界,从而取得了较小的实际风险,提高了模型的泛化能力,这一优点在小样本学习中更为突出;同时,它将优化问题转化为求解一个凸二次规划的问题,二次规划所得的解是唯一的全局最优解,这样就不存在一般神经网络的局部极值问题;另外,它运用核函数巧妙的解决了维数问题,使得算法的复杂度与样本维数无关。这样它避免了人工神经网络等方法的网络结构难于确定、过学习和欠学习以及局部极小等问题,不仅具备很强的非线性建模能力,而且具有全局最优、结构简单、小样本推广能力强等优点,被认为是目前针对小样本、非线性、高维数、局部极小值等问题进行分类、回归的最佳理论,并成功的应用于模式识别、回归分析、函数逼近、信号处理和时间序列预测等方面。
SVM方法的基本思想是:基于1909年核展开定理,可以通过非线性映射,把样本空间映射到一个高维乃至于无穷维的特征空间,使在特征空间中可以应用线性学习机的方法解决样本空间中的高度非线性分类和回归等问题。这是也是适用于房地产信心指数预测的前提条件,原因是房地产信心指数变化基本上呈现非线性。
8.2 支持向量机法的类型
(1)最优划分超平面与支持向量
分类问题可描述为:根据给定的训练集:
T={(x1,y2),……,(xn,yy)}∈(X×Y)n
其中,xi∈X=Rn,yi∈Y={-1,1},i=1,2……n。寻找X=Rn上的一个实值函数g(x),使之可以用决策函数f(x)=sgn(g(x))推断每一个x相对应的y,也就是找到一个把Rn上的点分成两部分的规则。如图7为二维空间上简单的线性可分分类问题,讨论函数g(x)为线性函数g(x)=(w·x)+b的情况。此时分类问题是要寻找一条合适的直线划分整个2维平面,即确定法方向w和截距b。(2)支持向量分类机
前面所讨论问题的算法就是线性可分离的二类划分的SVM分类机,这种方法对于一般n维空间中类似的分类问题也适用。对线性不可分离的二类划分可引入松弛变量ξi≥0,把约束条件放松为y1(<w,xi>)+ξi≥1,显然描述训练集被错划的程度,这样现在就有两个目标:即希望间隔尽可能大,同时希望错划程度尽可能小。因此引进一个惩罚参数C,把这两个目标综合起来,即极小化新的目标函数,这里C作为两个目标的权重。对k类线性划分,可以转化为k个二类划分。对非线性分类问题,通过引入核函数K(xi,xj)转化为线性分类。这是处理一般分类问题最常用的方法。
(3)支持向量回归机
SVM用来估计回归函数时,有三个特点:①利用在高维空间中定义的线性函数集来估计回归;②利用线性最小化来实现回归估计,风险用Vapnik 的ε不敏感损失函数来度量;③采用的风险函数是由经验误差和一个由结构风险最小化原则导出的正则化部分组成的。这部分是房地产信心指数研究应用的重点,即通过回归机对房地产信心指数相关问题进行预测与分析。
8.3 基于支持向量回归机的预测模型
针对房地信心指数,回归问题可以描述为:根据给定的训练集
T={(xi,yi),i=1,2……,l}∈(X×Y)l
其中,xi∈X=RN为输入值,为各类房地产信心指数值,yi∈Y=R为对应的目标值,为各类房地产信心指数值,l为样本数。通过样本训练后,对样本以外的x,通过RN上的一个实值函数f找到对应的y,即回归分析。
回归问题与分类问题结构相同,不同之处仅在于它们的输出取值范围不同。在分类问题中,输出只允许取两个值(或有限个值),而在回归问题中,输出可取任意实数。支持向量回归机主要有ε-支持向量回归机、v-支持向量回归机和最小二乘支持向量回归机。前两种回归机所选取的损失函数都是ε-不敏感损失函数。
定义ε-不敏感损失函数为:其中,f(x)为通过对样本集的学习而构造的回归估计函数,y为与x对应的目标值,ε>0为设计参数,规定了估计函数在样本数据上的误差要求。该ε-不敏感损失函数形象地比喻为ε通道,ε越小,估计函数与样本数据的误差越小,对训练样本的估计精度越高。
由上述分析可以看出,支持向量机可以在小样本的情况,较好的处理非线性回归和预测问题,这在信心指数建立的初期是十分有效,原因是初期数据量较小。支持向量回归机是房地产信心指数研究应用的重点,其应用原理及机制在上述回归机问题描述中已经给出,即如何将房地产信心指数与支持向量机结合起来。