第一章绪论
1.1选题背景
农业生产直接关系到人类生存与发展,粮食产量的稳定是社会可持续发展的关键,产量水平成为农业可持续的一个重要衡量标准[1]。而粮食产量除受技术、品种因素影响外,一个重要的环境条件就是气候状况,它为农作物提供物质、能量基础,又是农业技术有效实施的一个限制因素。近百年来,地球气候正经历以全球变暖为主要特征的变化,它已经成为全球公认的环境问题,成为关系到人类生存的热门话题[2]。众所周知,中国国土辽阔,从南到北兼有热带、亚热带、暖温带、温带、寒温带几个不同的温度带。同时,影响中国气候的最主要因素是地理讳度和太阳辐射、海陆位置和洋流、地形及大气环流。因此,中国气温和降水的季节性变化明显、气候复杂多样。大量研究表明,气候变化对农业的生产具有显著的影响,其中包括有利和不利影响,但多数是不利影响,就加大了粮食生产的不稳定性,IPCC曾在第二次.评估报告指出[3]气候变化将对中国农业产生重大影响,如果不采取任何措施,到2030年,中国种植业生产能力在总体上会下降5%~10%;第四次报告又指出[4],全球气候变化对那些适应能力差、生产异常脆弱的地区的农业十分不利,亚洲将是气候变化影响严重而脆弱的区域,预测2050年亚谷物产量可能减少30%。在气候变化背景下研究一地区作物的气候生产潜力,弄清气候生产生产力水平和光、热、水资源的配合协调程度,了解不同要素对生产力影响的大小;运用气候规律来提高农业生产力以及防灾减灾、趋利避害,进而实现农业的高产、优质、高效、安全、生态和可持续发展[5]。在此基础上,对气候生产潜力进行科学区划,可以合理利用农业资源、制定农业规划和生产布局提供重要参考,对发展农业有十分长远的意义。
…………
1.2国内外研究现状
目前将数据挖掘应用在农业气象上面的研究非常少,在主要的中文期刊数据库中,以“气象农业+数据挖掘”为关键字进行组合搜索,其相关文献搜索结果为0,在以“农业+数据挖掘”进行组合搜索,检索到相关文献中,发表于2007年之后共有23篇。发表在国内核心期刊上的共有12篇。邢平平等(2001)提出基于本体的农业数据挖掘的研究观点,本体即是对某一领域抽象成的一组概念。郑向群等(2003)提出了构建农业环境信息的数据仓库,但没有提出具体的模型系统。张锦変等(2005)提出了对农业市场信息进行数据挖掘的观点,但文中仅对可能用于农业市场信息挖掘的方法和挖掘的难点进行了概述。龙腾芳(2005)探讨了数据挖掘技术在农业的应用领域,比如农业环境信息、品种资源信息等方面。刘德军等(2007)提出利用数据挖掘技术促进农业物流体系的创新和优化,但本文侧重于阐述数据挖掘技术在现代农业物流体系创新与优化中作用和意义,但没有涉及数据挖掘技术的具体模型。张浩等(2007)探讨了农业空间数据的数据挖掘研究,提出研究方法和一般处理过程,并给出了农业空间数据挖掘的系统框架结构[27~32]。但是,以数据挖掘的基础算法做研究的内容有很多如利用遥感影像的光谱信息反演得到LAI。生物量等长势指标,并基于这些长势指标与产量之间相关性,建立回归模型,进行冬小麦长势监测和产量估算;基于遥感信息和冬小麦产量形成的生理生态过程相耦合的估产模型进行预报等[33~35]。
…………
第二章关键技术
2.1 GIS技术
本章节主要介绍了基于GIS农业气象空间信息数据挖掘系统的关键技术:GIS技术与数据挖掘技术。其中前者包括了农业气象空间信息的空间数据的采集、编辑、管理、分析、统计、制图等功能;后者包括了农业气象空间信息的属性数据的清理、集成、选择、变换、模式发现、模式评估和知识表示等功能。前者是后者的数据基础,后者为前者提供分析方法,前者是后者的可视化显示,后者为前者提供决策支持。地理信息系统(Geographic Information System, GIS)是以采集、存储、管理、分析、描述和应用整个或部分地球表面与空间和地理分布有关的数据的计算机系统。它由硬件、软件、数据和用户有机结合而构成,它的主要功能是实现地理空间数据的采集、编辑、管理、分析、统计、制图等[7]。本文主要研究了空间查询技术与空间分析技术。利用空间索引机制,从数据库中找出符合该条件的空间数据。(1)空间关系查询:空间实体间存在着多种空间关系,包括拓扑、顺序、距离、方位等关系。包括:面面查询、面线查询、面点查询、线面查询、线线查询、线点查询、点面查询、点线查询。(2)空间关系和属性特征的联合查询:目前的空间查询是通过对标准SQL进行扩展,即在其中加入空间关系查询。如增加空间数据类型(如点、线、面)和空间操作算子(如求长度、面积、叠加等)。
…………
2.2数据挖掘技术
农业生产直接关系到人类生存与发展,粮食产量的稳定是社会可持续发展的关键,加上气候问题一直是人类所面临的最为严峻的问题,为此找出合理的方法来研究农业与气象二者的关联,显得尤为重要。当前,数字城市工作已陆续启动开展,构建基于GIS的农业气象信息数据挖掘平台系统,更好地科学利用基础数据;能高效、灵活地对农业气象基础数据做出准确分析提取;同时将现有的数据资源进行深入的分析与挖掘,来辅助农业发展,找到气候与农业规律来提高农业生产力以及能做到防灾减灾、趋利避害。数据挖掘(DataMining),又译为资料探勘、数据采矿。它是数据库知识发现(Knowledge-Discovery in Databases,KDD)中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rule learning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现相应目标。数据挖掘是从海量数据中发现有趣模式的过程。作为知识发现过程,它通常包括数据清理、数据集成、数据选择、数据变换、模式发现、模式评估和知识表0数据挖掘分析流程,如图2-1所示:
…………
第三章系统设计...........16
3.1系统设计目标.........16
3.2系统架构设计.........16
3.3系统数据库设计.........18
3.4系统功能设计.........21
第四章系统实现.........34
4. 1系统环境.........34
4. 2算法设计.........34
4. 3功能实现.........61
4.4系统部分展示.........74
第五章系统应用.........77
5.1冬小麦产量预测.........77
5.2夏玉米产量预测.........85
5.3冬小麦产量评估.........94
5.4夏玉米产量评估.........100
5.5气象灾害评价.........106
第五章系统应用
5.1冬小麦产量预测
根据国家气象中心需求,以冬小麦为例开始对冬小麦年产量进行预测,原始各个地区冬小麦2005年产量,如图5-1所示:农业气象信息中心数据主要包括基础地理信息数据、农业信息数据、气象信息数据、土壤信息数据、产量信息数据、统计变量信息数据、行政地区数据、气象站点数据、模型信息数据以及各自的元数据。数据主要以矢量数据、栅格数据、属性数据和为主。为提高数据的存储效率与用户访问速度,本系统采用Oracle llg对系统中的属性数据进行一体化管理。Oracle是当今功能最为强大的大型数据库平台,能够很好地处理海量数据。本系统采用ArcGIS对系统中的矢量数据进行管理。
…………
结论
本系统针对农业气象信息中心数据与业务,研究实现了 GIS技术、多元统计技术、灰色系统技术、机器学习技术、模糊数学技术、神经网络技术、遗传基因技术、群体智能技术与时间序列分析技术,并应用于产量预测、产量评估与气象灾害评价,可以看出,数据挖掘技术应用到气象农业领域是完全可行的、高效的、科学的;同时,不同的模型需要不同的数据分析环境,本文针对冬小麦产量预测发现多元线性回归方法、模糊神经网络分析、趋势分析等效果较好;针对夏玉米产量预测发现偏最小二乘回归方法、多种群进化神经网络分析、序列拟合等效果较好;针对冬小麦产量评估发现线性判别分析、核判别分析、决策树与支持向量机等效果较好;针对夏玉米产量评估发现线性判别分析、核判别分析、决策树与支持向量机等效果较好;针对气象灾害评价发现模糊综合评价分析与灰色综合评价分析效果较好。由此,基于GIS的农业气象信息数据挖掘平台系统的实现为深入分析与挖掘农业气象信息中心数据资源,辅助农业生产,探索气候与农业生产的关系,进而提高农业生产效率,防灾减灾、趋利避害提供了可靠的技术平台。
……………
参考文献(略)