第1章 绪 论
化探即地球化学找矿,是地勘项目中最常用的找矿方法之一,也是各地勘项目管理系统的重点监管内容。当今计算机信息技术飞速发展,软件工程、网络技术、地理信息工程(Geographic Information Engineering)等相关技术被广泛应用于化探工程项目的监督管理中,使得传统的纸质数据采集、数据传输、数据处理、数据展示的数据管理模式逐渐被替换。地勘项目管理系统的投入使用极大的提高了化探工程项目的监管效率、监管力度和监管水平,海量的化探数据、空间数据被存储在关系数据库中,通过监管手段可以方便的查看相应的监管信息,并且能够应用数据挖掘(例如,数据包络分析 DEA、BP 神经网络、关联规则等)对其进行监管分析,帮助勘查监管单位对化探项目的实施进度等全程把控,节约生产成本,提升生产效率。本章主要内容有:本课题的项目依托、研究背景、研究意义、发展现状、工作量及论文组织结构等。
1.1 研究背景及意义
本课题依托国土资源部下属单位中央地质勘查基金管理中心(以下简称“地勘基金”)的监管项目“中央地勘基金项目远程调度监管平台”(以下简称监管平台或CGEFS)中化探监管子模块,旨在探究在基于GIS 的化探工程项目监管过程中,数据包络分析在化探数据、空间数据中的应用,为勘查单位提供决策依据,帮助勘查单位对化探项目的实施进度等全程把控,节约生产成本,提升生产效率。
1.1.1 研究背景
公益性矿产勘查曾经是我国地质勘查的一种重要方式,但是其弊端显而易见:资金投入大,而大部分的矿产资源在发现商业性价值后却被企业以无偿的形式拿走,难以实现矿业权价值,形成矿产勘查投入产出不平衡的恶性循环,至今无偿占有国家投入资金探明矿产地矿业权的国有企业仍有很多。因此,探索建立新的地质勘查与监管机制变得刻不容缓。与此同时,我国工业化进程持续加快,对资源尤其是矿产资源的需求持续攀升,而与经济社会发展密切相关的重要矿产资源如石油、铁、铜等对国外的依赖程度不断提高。矿产资源的高对外依存度和资源环境约束严重制约了我国经济社会发展。
中央地勘基金建立后努力探索,如为了保障公开、公平、公正,中央地勘基金项目在立项方式、投资方式上面向社会开放式运作;对地质勘查投入产出比做出约束性规定;开辟合同管理制新形式,探索收益分配均匀、兼顾多方利益、全面调动各方积极性的新举措等,取得了初步的进展。
1.2 国内外研究现状
信息化是当今信息时代经济社会发展的大趋势,飞速发展的计算机信息技术、网络技术等为加速我国现代化建设提供了便利的条件。地勘基金的监理项目产生的地质勘查信息、监管信息,信息量巨大且具有明显的空间特征,监管平台的建设是加快推进国土资源信息化建设的一部分,对带动国土资源尤其是矿产资源管理方式的根本转变,提高地勘项目监管水平,及时准确科学地掌握国土资源现状与动态变化,具有十分重要的研究意义。
目前,中国地质调查局所进行的地质调查信息化建设是国土资源信息化的重要组成部分并且取得的诸多突破性的成果。其研制的区域地质调查数字采集系统成功的将 3S(GIS、GPS、RS)进行有机集成,可以使 GPS 的当前定位标注在遥感图像或地形图上,同时该数字采集系统实现了野外原始信息采集由纸质方式向数字化方式的转变。在钻探工程项目方面,完善了钻孔采编系统,该系统具有钻孔地质数据采集、数据存储与管理、钻孔图件绘制等功能特性,使钻探项目的数据采集工作变得较为方便,该系统现已全面推向社会,得到了多数地质工作单位的认可并且现已广泛应用。
在基础地质数据库系统的建设过程中,地质调查信息化建设完成了如下工作:完成1163幅1:20万区域地质调查图的矢量数字化和数字地质图空间数据库的建库工作,该空间数据库共包括约2000万个地质实体,总数据量约90GB,包括 AcrInfo 和 MapGIS 两种数据格式,基本满足了地质工作者的格式需求,能够方便快捷的进行查询检索等功能;完成 800余幅1:5万区域地质调查图的矢量数字化和数字地质图空间数据库的建库工作;完成965幅1∶20万区域水文地质调查图的矢量数字化和数字地质图空间数据库的建库工作;完成我国30个省(区、市)110个图幅的1∶5万重点城市及经济开发区水文、工程和环境地质勘查综合地质图空间数据库的建库工作;完成全国矿产地数据库建设及数据整合,该数据库共采集了全国约25000个已知矿床、矿点信息数据,和近800个典型矿床的矿区地质图以及矿区剖面图数据;钻探工程项目的数字化进程方面,我国已积累 1.3亿米的钻孔地质原始资料,截止目前已完成了 10个省的350多个矿区包括大约120万米进尺回次的重要钻孔岩芯的原始编录资料如矿化特征、蚀变特征、采样位置、终孔深度的相关数据采集及数据库建设(数据来自中国地质调查局网站)。
第2章 空间数据库
化探工程项目不可避免的要应用到大量的地理信息,同时产生海量的空间数据,因此必须设计合理的空间数据库对其进行管理。本章概要介绍了空间数据库的有关理论知识,并简单介绍了本课题在研究和项目实现中所用的 GIS 相关技术。
2.1 空间数据库类型
简单来说,一切跟地理位置有关的信息数据都可以称之为空间数据。而早期的GIS 行业耗费了大量的资源致力于空间数据的管理,尤其是在空间数据的可视化方向以及对于空间实体的操作实现方向。但是 GIS 对于空间数据和关系数据的结合研究较为缓慢,这直接导致了地理信息需要分为空间数据和非空间的关系数据及其与空间数据的对应关系进行管理,即目前主流的空间数据库类型—组合型空间数据库。然而由于空间数据处理的复杂性,数据库管理系统(DBMS)对于关系数据的高效处理并不能适用于空间数据,因此目前对于空间数据库的研究重点就是要解决空间数据的存储及高效处理,即集成型空间数据库。本节将对于这两种类型的空间数据库的多种实现进行全面的介绍。
2.1.1 组合型空间数据库
组合型空间数据库是目前主流地理信息系统开发平台所采用的结构,发展较为成熟,非常适合单机 PC 上的空间数据存储管理。组合型空间数据库即文件系统与关系数据库的组合应用,空间数据以文件的形式交由文件系统存储管理,而非空间数据存储在关系数据库中交由 DBMS 进行管理。
我国的 MapGIS 平台采用的就是组合型的空间数据库,其产品使用多个不同的模块对空间数据进行存储和管理,如点文件存储为.WT 文件类型,线文件存储为.WL文件类型,多边形和区文件存储为.WP文件类型,而空间数据相关的非空间数据存储为.WB文件类型,其实质就是一张或多张属性表,交由关系数据库进行管理。在纵向上,点、线、面被分层进行组织,相互叠加组成空间数据的基本元素;而在横向上,空间数据按图幅或区域分别组织,相互连接。
组合型空间数据库对空间数据和非空间数据的统一管理是通过空间对象的几何图形数据和属性数据两者之间共同的唯一标识码或者内部连接码,地理信息系统平台在空间数据可视化时根据该标识码从关系数据库中检索对应属性。在组合型空间数据库中,除了该标识码是作为连接关键字为空间数据和非空间数据共同拥有,两者是被独立的不同模块进行组织和管理的。
组合型空间数据库结合了文件系统和关系数据库的优点,如由于空间数据文件所占磁盘空间相对来说很小,文件系统下的数据存取资源消耗同样很小;而属性数据的存储和检索则利用了技术上早已成熟的数据库管理系统,能够保证属性数据的一致性、完整性等。
但是当数据量大幅上升或者需要用到分布式的并发操作时,组合型空间数据库的瓶颈就凸显出来了,大数据量的空间数据必然产生大量的数据冗余,使其对文件的管理较为繁琐和混乱,而文件系统管理缺少的并发控制使得多用户下的并发操作更加不可能。地理信息系统在单机 PC的 GIS 开发平台之外的应用需求,如WebGIS、分布式GIS 等需要不同的空间数据库系统。
2.2 空间数据模型
空间数据模型是对空间数据的抽象提取,是对现实世界地理信息的模式表达。空间数据是地理信息系统的核心,而空间数据模型承载着空间数据的存储、管理、可视化表达等,决定了 GIS 系统的可靠性和灵活性。根据 GIS 系统的具体应用和空间数据的特点选取合适的空间数据模型对空间数据进行表达是地理信息系统应用的关键。经过多年的发展,空间数据模型的逻辑模型已经基本成熟并且广泛使用,本节将对这些空间数据逻辑模型进行具体的介绍。
2.2.1 栅格数据模型
栅格数据模型将整个地理空间分割为多个规则的大小相同的形状(通常情况下是正方形),每个正方形称为一个象元。在栅格数据模型中,点元素即由单个的象元表示,线元素则是由一连串相邻的象元表示,而面元素是多个相邻元素的集合。由此可以认识到,栅格数据模型的精度取决于单个象元的大小,点、线、面之间并没有严格的界限。
栅格数据模型的每个象元除了位置信息外都存储有一个数值用以表示相应的属性信息,例如土地利用类型、植被覆盖类型等。栅格数据模型具有地理位置信息隐含的特点,通过栅格数据文件头信息中的行列数以及象元记录的顺序即可对每个象元的空间坐标进行计算,应当注意的是,通常栅格数据模型自身是不含空间参考信息的,在使用栅格数据时应当匹配地理坐标信息,即多数 GIS 软件拥有的空间配准功能。
栅格数据的来源十分广泛,主要包括遥感卫星影像、航空照片、图件扫描数字化等。同时栅格数据的简单数据结构使其应用十分方便,尤其是在进行叠加操作时栅格数据具有很高的效率,但是在进行比例尺变化、投影变换等操作时则涉及大量的数据运算,效率不高。
由于栅格数据模型的存储空间随着分辨率的增大成几何倍数的增大,通常采用压缩编码方式,如游程编码、四叉树编码等方式进行压缩存储。
2.2.2 矢量数据模型
矢量数据模型是对空间数据的精确表达,该模型通过以点坐标的方式记录空间数据,从理论上保证了空间数据的准确性。在矢量数据模型中,点元素表达为单个坐标数据,线元素则是多个连续的点元素按照顺序连接而成,两点之间的连线由相应的算法具体画出,而面元素则可以理解为首尾相接的线元素。
第3章 数据包络分析................ 21
3.1 DEA 的提出 ............ 21
3.2 DEA 进展 ...................... 22
第4章 系统设计..................... 36
4.1 化探子系统架构简介...................... 36
4.2 化探工程项目关系数据库设计................... 38
第5章 系统实现与展示............. 59
5.1 系统开发和运行环境...................... 59
5.2 程序界面、功能演示........... 60
第5章 系统实现与展示
本课题以 VS 2008 为开发平台,以 MapGIS 作为二次开发组件,并使用其空间数据引擎对空间数据进行管理,具体的实现是依托地勘基金监管平台中的化探工程项目模块的实施完成。本章将依据前一章提出的系统详细设计对模块各项功能进行具体的实现。
5.1 系统开发和运行环境
本课题实现是依托地勘基金监管平台中的化探工程项目模块,受项目施工和监管过程中网络环境的影响,系统分为 B/S、C/S 两种架构进行实现,其中 B/S网站架构为主体,通过网络进行监管项目实时的各项数据采集、监管、分析、空间数据可视化等;C/S结构部分为辅,为勘查人员和监管人员在缺少网络环境,或者使用手持设备的情况下提供数据采集业务,数据在本地存储,适时再经由网络上传至监管平台。监管平台部署运行时的搭建架构如图 5-1所示。
系统采用流行的 ASP.NET框架和Flash Action Script3.0技术,两者结合,确保了系统的稳定性和开发进度,同时为用户提供了优秀的视图效果。系统的空间数据存储采用了MapGIS-SDE组件,空间数据展示采用了 MapGIS IGServer 的Flash Action Script 开发展示,具体的开发及运行环境如表 5-1 所示。
第6章 总结与展望
化探工程项目监管是本课题的研究内容,课题研究背景表明地勘项目的监管需要GIS 技术的全方面参与。美国联邦地质调查局已经以公开透明化的方式向公众提供了全国矿产资源的空间数据,其中化探数据占有相当大的比重;随着地勘基金监管平台的建立,我国的矿产资源化探空间数据库也将全面组建。
课题在研究过程中突出了地理信息系统的重要性。为了存储和管理海量的基础地理数据以及化探工程产生的空间数据,重点研究了空间数据库相关理论知识,包括四种空间数据库类型、三种主流空间数据模型。地勘基金监管平台以MapGIS 平台做为 GIS 开发平台,使用 MapGIS-SDE 空间数据引擎承担了空间数据在Oracle 数据库中的存储管理;使用 MapGIS IGServer 做为WebGIS 的二次开发平台和空间数据发布平台。课题对空间数据引擎和 MapGIS IGServer 的工作原理和系统架构都进行了深入的研究。
数据包络分析在化探监管中的应用是本课题的研究创新点。课题深入研究了数据包络分析理论的基本原理,探讨了DEA 的主要实现模型。在化探工程项目中,抽取了化探采样点数、异常记录数、音像采集数、施工人数、天数、资金投入六个指标,并以此为切入点作为 DEA的原始数据,进行数据包络分析,对各个施工单位的相对效率进行了评价。
目前项目一期工作已经完成并且顺利通过验收,化探工程项目子系统能够实现技术人员的工程数据采集,监理人员的进度监管,空间数据可视化等功能。但是该系统还有如下需要进一步改进的方面:
1) 效率方面,系统采用的 IGServer 的 Flash ActionScript3.0 开发方式,在提供优秀的用户界面的同时也极大的加重了服务器和网络的负担;flash 对数据库的操作也只能通过中间层的网络服务,资源消耗较大。
2) 空间数据挖掘方面,空间数据目前只用于地勘基金项目的监管,如何利用空间数据挖掘实现有效探矿也是项目未来的重大挑战。
参考文献(略)