第一章绪论
1.1课题研究背景
为保证税务部门内部各个应用系统之间的数据交换,实现国地税之间纳税人信息和征收信息的数据共享,进而提高征管水平,实现综合治税,在国家税务总局《关于加强国家税务局地方税务局协作的意见》的指导下,各税务部门正在计划或逐步推进数据交换及比对平台的建设。“两税信息比对系统”(以下简称NLICS)是一个在综合治税大背景下的大课题,是一个涉及到社会各个部门的系统工程,从大的范围上讲,是电子政务工程的一部份,不仅仅是国地税部门之间的简单数据对照,我们既要考虑到税务系统当前的现实需求,更应该从更广泛的信息共享、综合治税的角度考虑数据比对的应用。课题来源于吉林省NLICS。吉林省自采用“吉林税收征管信息系统”(以下简称JTAIs)以来,信息化工作在网络建设、设备配置、业务系统开发应用等方面己逐步得到完善,具备一定的应用规模和应用深度,并取得了较好的应用效果。如何在税务决策支持方面吸纳新的信息处理技术、提高决策的科学性和规范性,成为吉林省地税系统下一步信息化建设工作的关键所在。在省局领导的直接支持下,吉林省地税局提出建设数据仓库与联机分析系统的课题。该系统遵循国家税务总局关于税务信息化“一个网络,一个平台,四个系统”总体规划的原则,其目标是在JTAIS的系统数据基础上建立规范统一、高度共享的综合性主题数据库,进而建设一个能够对税收收入的规模、构成、分布、发展速度、平均水平、平衡程度等特征以及增长变化规律和发展趋势,以及事物之间(如:GDP与税收收入ll])的相关关系、强度及均衡性等问题进行分析的平台;为提高办公效率、加强监控管理、正确分析税源、掌握税收指标、了解变化规律等方面提供丰富的信息。
JTAIS系统包涵了税收征管大量的基础数据,而JTAIS系统是事务处理的系统,面向前台业务应用,不具备快速、高效、便捷的获取信息的能力,导致基层单位的管理手段日益先进,而上级管理机关却仍然停留在以汇报和检查为主的传统的管理模式上,形成上级管理部门没有或拥有很少量的信息的局面。爱必克公司与吉林盟友软件公司,对JTAIS系统应用数据结构和应用环境进行了全面剖析,结合爱必克公司在国内多个行业建立起来的成功案例,提出吉林地税基于JTAIs系统数据仓库与决策支持系统的建设方案。预测就是依据历史的和现在的实际资料,结合科学的理论与方法对未来有可能出现的情况或发展趋势进行推测。应用在税收领域,形成了税收预测。具体来说,充分掌握对税收收入变动有影响的因素以及税收历史资料为基础,应用统计方法、数学方法、等推理预测手段,对未来税收收入的前景做出比较肯定判断的一项科学管理工作。税收计划是以税收预测为基础,在税收计划的各个阶段,尤其是在编制计划的准备阶段,税收预测有着不可替代的作用。税收预测为编制税收计划和检查税收计划提供依据,并可用于推测税收计划的执行结果。通过建立数据仓库、应用数据挖掘技术、构建联机分析处理平台、提供决策支持服务。最终将吉林地税信息系统建设成一套满足各级税务机关管理和决策应用、具有吉林地税特色、性价比优良、具有综合信息处理能力的税收业务智能化系统。
1.2.课题研究目的和意义
数据挖掘作为一个有着广阔应用前景的技术,研究其理论和方法,并将其同实际应用相结合,有十分重要的理论价值和现实意义。自从1994年我国实行分税制改革以来,标志着我国进入了适应社会主义市场经济的以工商税制为中心的税制结构阶段。税收是财政收入的重要组成部分,它体现了以国家为主体的分配关系,是国家调控社会经济的重要手段。因此,认真研究影响税收收入的主要因素,确定税收影响因素的作用机理和影响程度,建立系统的税收预测模型体系,客观准确地预测全国税收收入,对于合理界定财政预算支出,完善我国当前的财政税收体制,进一步规范中央预算构成均具有非常深远的意义。税收分析是针对税收情况,结合吉林省宏观层次的国民经济发展有关指标和微观层次的市场经济主体范围有关指标,利用相关科学的分析手段和方法进行综合分析、重点分析以及典型分析和评价,以满足不同税务部门的目的的使用需求。吉林省税收预测分析的意义可以总结为[2]:1.税收预测分析是编制、核定年度税收计划目标的前提条件和基础工作;2.税收预测分析是评价、考核税务系统主要税收业绩的重要工具和手段;3.税收预测分析是强化税务部门组织收入功能,解释各种矛盾和问题,预测税收收入前景的重要途径。本课题尝试将数据挖掘技术应用到吉林省税收信息化工作中,结合国内外税收预测研究的先进经验,把BP神经网络技术应用到NLICS税收预测工作中,通过对JTAIS历史存放的大量相关数据的分析,找出各种相关因素对税收收入影响的规律,建立税收收入预测模型,对各个时间跨度(年、季、月)的税收收入情况进行预测,结合财政经济以及税收经济理论,建立相应的地方财政收入预测模型,获得更准确的测数据,为吉林省税务机关编制合理的预算报告、进行宏观经济调控、监测税源稳定情况等都具有非常重要的意义和作用,进而提高吉林省税收计划制定的准确性和及时性,从而大大提高税务工作的效率。
第二章相关理论
2.1数据挖掘技术
数据挖掘作为一个只有十几年研究历史的较新研究领域,许多概念和技术是逐步发展起来的。因此,本节将系统地介绍相关的概念和技术,阐述数据挖掘的基本概念、特点、数据挖掘的任务和挖掘过程。
2.1.1数据挖掘的基本概念
数据挖掘(DataMining),简单地讲就是从大量数据中抽取或挖掘知识。又称为数据库中知识发现,它是一个从大量数据中抽取挖掘未知的、有价值的模式或规律等知识的复杂过程。数据挖掘涉及多学科技术的集成包括数据库技术统计学机器学习高性能计算、模式识别、神经网络、数据可视化、信息检索、图像与信号处理和空间数据分析。通过数据挖掘,可以从数据库提取有趣的知识、规律或高层信息,并可以从不同角度观察或浏览。发现的知识可以用于决策、过程控制、信息管理、查询处理,等等。由于数据库理论的发展促成了数据仓库的形成,人工智能的发展促进了机器学习的进步,同时这些技术与传统的数理统计理论的结合,因此,数据挖掘是一门交叉学科。数据挖掘把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,在大型数据存储库中,自动地发现有用信息的过程。数据挖掘还具有预测未来观测结果的能力。例如,预测一位新的顾客是否会在一家超市消费50元以上。
第三章数据仓库系统设计与实现........14
3.1开发目标.........14
3.2应用框架.........15
3.3系统的逻辑结构............15
3.4联机分析应用模块....16
3.5设计方法.............17
3.6面向税收分析预测数据仓库的实现.........17
第四章基于BP神经网络的税收收入.............21
4.1基本步骤.............21
4.2样本的选取和预处理...........21
4.3BP神经网络结构设计.............23
4.4训练算法及训练参数的选择..........26
4.5合理网络模型的确定...........29
4.6模型的解释和评估....29
第五章NLICS税收收入预测模型的实现............30
5.1数据源.......30
5.1.1数据源总体介绍及特点..........30
5.1.2税收收入预测指标的选择..............30
5.1.3Matlab获取数据.......31
5.2BP网络在税收预测中的具体应用............31
结论
通过在吉林省地税的应用情况证明,神经网络技术适用于预测个税收入,能够为领导提供决策依据。以NLICS中存储的海量历史数据为样本,研究税收收入预测的相关理论和方法,BP神经网络技术的思想、模型的特点、算法的学习过程,构建数据仓库系统的目标、应用的框架、设计步骤、系统结构、数据模型、实现的技术要求等,数据仓库技术和BP神经网络预测吉林省营业税收入得到了较好的预测结果,证实了神经网络预测的高效性和准确性,助于税务决策者们制定相关税务政策,更可以提高税务专管员们的日常工作效率。拓展了神经网络的应用领域,并丰富了国内收入预测的方法领域。
参考文献
[1] YOKOYAMA M, KWON G S, OKANO T, et al. Preparationhttp://sblunwen.com/sschlw/ of micelle-formingpolymer-drug conjugates [J]. Bioconjug. Chem., 1992, 3: 295-301.
[2] TIAN J, CHEN H, ZHUO L, et al. A highly selective, cell-permeable fluorescentnanoprobe for ratiometric detection and imaging of peroxynitrite in living cells [J].Chem. Eur. J., 2011, 17: 6626-6634.
[3] WU W C, CHEN C Y, TIAN Y, et al. Enhancement of aggregation-inducedemission in dye-encapsulating polymeric micelles for bioimaging [J]. Adv. Funct.Mater., 2010, 20: 1413-1423.
[4] LI K, PAN J,. FENG S S, Generic strategy of preparing fluorescentconjugated-polymer-loaded poly(dl-lactide-co-glycolide) nanoparticles fortargeted cell imaging [J]. Adv. Funct. Mater., 2009, 19: 3535-3542.
[5] OW H, LARSON D R, SRIVASTAVA M, et al. Generic strategy of preparingfluorescent conjugated-polymer-loaded poly(dl-lactide-co-glycolide)nanoparticles for targeted cell imaging [J]. Nano Lett., 2005, 5: 113-117
[6] LI Z F, RUCKENSTEIN E. Water-soluble poly(acrylic acid) grafted luminescentsilicon nanoparticles and their use as fluorescent biologicalstaining labels [J].Nano Lett., 2004, 4: 1463-1467.
[7] GAUCHER G, DUFRESNE M H, SANT V P, et al. Block copolymer micelles :preparation, characterization and application in drug delivery [J]. J. control.release., 2005, 109: 169-188.
[8] XU J P, JI J, CHENW D, et al. Novel biomimetic polymersomes as polymertherapeutics for drug delivery [J]. J. control. release., 2005, 107: 502-512.
[9] KWONA G, NAITOB M, YOKOYAMAC M, et al. Block copolymer micelles fordrug delivery: loading and release of doxorubicin [J]. J. control. Res., 1997, 48:195-201.
[10] GAO Z, EISENBERG A. A model of micellization for block copolymers insolutions [J]. Macromolecules, 1993, 31: 7353-7360.