(1)本研究一共收集了11596条2018年杭州市主城六区的二手住宅交易数据,经过剔除异常数据后,得到有效数据8969条。结合己有研究和杭州市房地产市场现状,选取了21个特征变量。其中5个建筑特征变量:所在层数、总层数、建筑面积、房龄、装修程度;8个邻里特征变量:物业费、绿化率、容积率、商业综合体数量、医院数量、重点学区、幼儿园数量、大学数量;5个区位特征变量:已建成地铁数量、在建中地铁数量、离西湖距离、离西溪湿地距离、离钱江新城距离;3个合成变量:楼层得分1、楼层得分2、离市中心的距离。经过相关性分析和特征变量重要性筛选,剔除了楼层得分1、楼层得分2、装修程度、离西湖距离、离西溪湿地距离、离钱江新城距离6个特征变量,最终15个变量进入模型训练。
第一章绪论
1.1研究背景
金融信贷和房地产评估息息相关,健康的信贷关系是促进房地产经济和金融信贷健康发展的保障,而住宅价格评估的市场价值是提供贷款额度的前提和根本。近年来,随着我国居民收入水平的显著提高,居民的住房消费能力也水涨船高,房地产信贷规模增速明显提高,部分地区甚至出现首付贷,主要是因为个人消费贷中所占的比例逐步提高。此外,三、四线城市的大规模开发,房地产库存积压严重,无法在短期内消化,开发商资金回笼压力大,房地产信贷存在违约风险。同时房地产贷款的额度基于住房成交价格,使得银行住房信贷风险进一步增加。从一、二线城市来看,就业机会多,社会福利好,基建设施完备,人口红利大,土地供应面临瓶颈,进一步导致房地产价格快速增长,城市房价收入比失衡,存在房地产泡沫的隐患。
.........................
1.2研究意义
研究杭州市二手住宅价格的批量评估问题具有重要的理论与现实意义,具体而言有以下几点:
(1)丰富房地产评估理论和房地产评估指标体系理论
房地产评估的三大基本方法是收益法、市场比较法和成本法,自我国20世纪80年代的土地改革和住房制度改革至今,以此为基础的房地产评估法被广泛应用,也日渐完善,但无法满足同时计算大量房地产价值的需求,且存在一定的主观局限性。本文在特征价格理论的基础上,讨论比较了传统的多元线性回归模型、机器学习中的随机森林模型和支持向量回归模型等智能学习模型在房地产价格评估中的应用效果,同时根据杭州市二手住宅市场实际情况,构建了杭州市房地产价格评估指标体系,实现了快速批量评估房地产价格的目的,同时达到准确、低成本的评估要求。
(2)降低房地产商业贷款中的信贷风险
目前,商业银行面对的主要风险就是信贷风险,主要产生于商业贷款中的住房抵押贷款。若不能及时有效地采取措施来解决信贷风险,将对银行带来巨大的风险,甚至威胁到整个行业。住房抵押贷款作为商业银行的主要业务,是商业银行收入的重要来源之一。据我国银行体系的调查结果表明,以房屋作为抵押物的资产变现率较低。主要原因是,商业银行发放贷款的主要参考抵押物(不动产)的价值,如果被抵押物评估价值虚高,可能造成抵押物实际变现价值低于基于评估价值确定的贷款额,进而给商业银行带来不可估量的风险。通过选用合理的自动评估模型,可以有效提供抵押物的参考价值,为商业银行房贷提供决策支持,有助于加强商业银行的风险管理。
......................
第二章相关理论与文献综述
2.1相关概念
2.1.1房地产价格评估
房地产价格评估,是指房地产评估师根据评估目的,在遵循评估原则的基础上,按照评估程序,选用适当的评估方法,综合分析影响房地产价格的因素,在评估时对客观,合理的房地产价格或价值进行评估和确定的活动。
房地产估价基本程序为:明确估价基本事项(包括明确估价目的、估价对象以及估价时点拟定估价作业方案--搜集估价所需资料--实地查勘估价对象--选定估价计算方法--确定估价结果--撰写估价报告--估价资料归档。
常用的房地产估价方法有市场比较法、收益法、成本法、假设开发法、基准地价修正法以及这些综合方法的运用,适合于单宗房地产估价。
需注意的是:“房地产估价是科学和艺术的结合,对房地产价格或价值的判断需依赖于科学的理论与方法,但是又不能完全拘泥于估价理论与方法,需要依赖于估价人员的经验,依赖于他对影响房地产价格的各种因素的综合分析与判定。
..........................
2.2住宅价格影响因素的研究现状
影响住宅价格的因素多而复杂,需要一一分类。柴强将影响因素先分为房地产自身因素和房地产外部因素,然后再进一步细分。影响住宅价格的房地产自身因素分为实物因素、权益因素和区位因素三大类,房地产外部因素可以分为制度政策因素、社会因素、经济因素、人口因素、国际因素和其他因素等六大类,同一地区的住宅价格评估可认为政策、经济、人口等外部因素相同,故本文主要研究房地产内部因素对住宅价格的影响。
批量评估能够高效率、低成本地实现大规模目标的价值评估任务,伴随着计算机的普及,欧美等发展国家开始将批量评估广泛应用于房地产税基评估和其他价值评估。此外,一些发展中国家诸如泰国、印度等也开始在房地产税基评估中推广批量评估。中国香港在上世纪80年代就开始在差饷的估价中运用计算机辅助批量评估,目前85%的差饷估计都是借助于计算机辅助批量评估的。
...........................
第三章杭州市二手住宅评估指标体系构建.................26
3.1杭州市区域概况..................26
3.1.1自然地理条件.................26
3.1.2社会经济情况...................26
第四章数据质量控制与特征选择................42
4.1数据质量控制................42
4.2候选变量的分析................42
第五章杭州市二手住宅价格评估模型...............56
5.1数据准备...............56
5.2多元线性回归模型...............56
第五章杭州市二手住宅价格评估模型
5.1数据准备
在模型构建过程中,一般将数据集划分为训练集和测试集,训练集用于构建模型和训练模型,测试集用于测试模型性能。划分数据集不仅是为了模型构建过程的完整性,同时为了防止出现过拟合现象而导致模型整体性能下降。在机器学习中,通常将数据集按3:1的比例划分为训练集和测试集。
为了保证在分割后的训练集和测试集均匀,确保样本相似度较高,笔者采用分层抽样的方式对原始数据集进行分割。本研究数据来源于杭州市主城六区的真实交易数据,为确保最终模型的准确性,数据分割结果在杭州市主城六区上应均匀分布,最终笔者按行政区分层抽样的方式对原始数据集进行分割。
本研究一共8969个样本量,按照训练集和测试集3:1的比例进行分割,以下为数据集分层抽样的结果,如表5-1所示:
........................
第六章结论与展望
6.1研究结论
利用统计模型和机器学习算法进行住宅价格评估是近几年国内外学者研究的重点,也是未来批量自动评估的趋势。本文在国内外研究理论和评估技术的基础上,结合当前流行的机器学习算法对房地产估价进行研究,得到了以下几个基本结论。
(1)本研究一共收集了11596条2018年杭州市主城六区的二手住宅交易数据,经过剔除异常数据后,得到有效数据8969条。结合己有研究和杭州市房地产市场现状,选取了21个特征变量。其中5个建筑特征变量:所在层数、总层数、建筑面积、房龄、装修程度;8个邻里特征变量:物业费、绿化率、容积率、商业综合体数量、医院数量、重点学区、幼儿园数量、大学数量;5个区位特征变量:已建成地铁数量、在建中地铁数量、离西湖距离、离西溪湿地距离、离钱江新城距离;3个合成变量:楼层得分1、楼层得分2、离市中心的距离。经过相关性分析和特征变量重要性筛选,剔除了楼层得分1、楼层得分2、装修程度、离西湖距离、离西溪湿地距离、离钱江新城距离6个特征变量,最终15个变量进入模型训练。
(2)利用网络爬虫技术,爬取安居客房源数据,并对数据集中的物业费、绿化率、容积率字段进行补全;利用百度地图API和网络爬虫技术,抓取小区的POI数据,如商业、医院、幼儿园、大学;利用腾讯地图API和网络爬虫技术,抓取小区附近已建成地铁情况和在建中地铁情况。通过数据补全,使得数据集中的字段缺失率降低至0。
参考文献(略)
杭州市二手住宅价格评估模型研究
论文价格:0元/篇
论文用途:仅供参考
编辑:论文网
点击次数:0
Tag:管理论文,批量评估,特征价格理论,多元线性回归
如果您有论文相关需求,可以通过下面的方式联系我们
客服微信:371975100