基于数据挖掘的股票行情波动趋势系统的研究与设计
摘 要
股票市场的发展情况关乎我国经济的发展情况,其在经济发展中所占的分量也来越大,在金融投资领域中能否准确的进行股票的预测至关重要。股市往往具有复杂性和不确定性的显著特点,股市的发展往往受到诸如国家出台的对于股市的管理办法、经济的发展情况、以及股民自身的投资心理例如盲目从众等因素的影响,同时随着经济的发展股票交易量越来越大,股票价格变化通常体现在细微的数据变化当中,因此要对它进行建立模型是非常困难的。数据挖掘技术的出现则提供了一种挖掘有效数据提供有效信息的数据处理技术,对于该技术对股票信息进行研究整理和预测的需求有着非常重大的现实意义。
本文构建了基于BP神经网络的股票波动趋势数据挖掘架构,共分为数据层、模型层和用户层,其中数据层通过对原始股票数据文件进行整理,形成Data.xls文件,对这些数据再进行预处理后存储到SQL Server数据库中;在模型层中,建立神经网络模型库,利用基于自适应BP神经网络模型进行规则分析,得到的结果在用户层通过神经网络模型拓扑结构和规则显示展现给用户,从而得到决策支持的目的。
在系统实施方面,本文所提出的将数据挖掘技术神经网络做预测的策略,是在研究股票投资理论以及股价预测方法的理论基础上提出来的,系统通过获取股票历史及时实交易数据,来研究分析各技术指标值,并输入数据库。结合技术指标的形态变化字走势情况来选取集中股票投资方案,按照输入的股票技术指标值来确定最优股票,通过绘制股票K线图和技术指标图,对其设定股票价格变量,相应的得到第二天的交易情况,并通过观察图像的走势形式来获取变化情况,便可大致预测股价走势,再结合技术压力位和支撑位来分析研究股票的走势情况。大量的实验结果反映,神经预测系统具有可行性,并最终会展现其成果。本系统运用强大的计算能力将具有灵活高效特点的Delphi的编程技术与Matlab完美的结合在一起,从而具备运行稳定、运行速度快、操作简单易上手、功能强大的优势。
关键词:股票;技术指标;数据挖掘;股票预测;神经网络
ABSTRACT
Stock market as an economic "barometer" plays a very important role in China's economy, effective stock forecast occupies an important position in the field of financial investments. But stock markets affected by the policy, the economy, and investor psychology, and many other complex influences, and is a very complex system, and has the characteristics typical of the complex uncertainties, very difficult to model and data size and stock transactions, for regular stock price information is often contained in these vast amounts of data. And rapid development of new technologies of data processing-data mining provides an implied from these huge amounts of data, valuable information is an important means, so take advantage of the technology to analyze and forecast the stock information is an important theoretical and practical significance.
Paper building has based on BP neural network of stock fluctuations trend data mining schema, total is pided into data layer, and model layer and user layer, which data layer through on original stock data file for finishing, formed Data.xls file, on these data again for pre-processing storage to SQL Server database; in the model layer, established neural network model library, using based on since adapted BP neural network model for rules analysis, The results obtained at the user level by a neural network model structure and rules appear to show to the user, so as to get decision support purposes.
In terms of system implementation, this paper is based on in-depth analysis and price forecast methods based on the theory of stock investments, from a practical point of view, proposed using data mining neural network forecasting of ideas and methods. Download stock transaction history of the system data and real-time market data, technical index of the calculation, and write them to the database. Technical indexes studies on the morphological characteristics and summed up stock selection, stock specification by querying the database to select stocks that meet the criteria, and according to its technical pressure and support levels to predict short-term movements in the stock and share prices. Stock price forecast, stock chart and technical indicators are drawn, simulated by adjusting the stock price quotes for the next day trading, candlestick and technical indicators, real-time changes were observed, you can calculate the next day's general trend and price. Lots of simulation results indicate that neural prediction in the security system there is a certain practicality, further study will provide investors with accurate decisions and rewards. Delphi's flexible and efficient programming of the system combined with powerful computing capabilities of Matlab, with quick, simple operation and stable running of powerful features.
Keywords: Stock Specifications, Data Mining, Stock Forecast Neural Network
目 录
目 录 4
第1章 绪论 1
1.1 研究背景与意义 1
1.2 国内外研究现状 2
1.2.1计算机技术在证券行业的应用方面 2
1.2.2对海量数据进行利用和分析方面 3
1.2.3智能数据分析技术方面 3
1.2.4数据挖掘技术方面 4
1.3 本文研究内容与研究框架 5
1.3.1研究目标 5
1.3.2研究内容 6
1.3.3研究方法 8
第2章 系统相关技术概述 9
2.1 数据挖掘技术 9
2.1.1数据挖掘概念 9
2.1.2数据挖掘模式 9
2.1.3数据挖掘过程 10
2.2 时间序列预测技术 12
2.2.1 时间序列内涵 12
2.2.2 时间序列分类 12
2.2.3 时间序列预测 13
2.3 股票基本分析技术 14
2.5 UML建模语言 15
2.6 本章小结 16
第3章 基于数据挖掘的股票行情波动趋势分析模型设计 17
3.1 BP神经网络模型设计 17
3.1.1神经网络简介 17
3.1.2神经网络模型 18
3.1.3神经网络结构和工作方式 21
3.1.4神经网络学习方法 23
3.2 BP神经网络分析股票波动趋势方法 24
3.2.1 总体框架设计 24
3.2.2 数据预处理设计 25
3.2.3 BP神经网络结构设计 26
3.3 基于决策树的股票波动趋势分析模型 29
3.4 本章小结 30
第4章 股票行情波动趋势分析系统的设计 32
4.1 系统设计目标与原则 32
4.2 系统架构设计 33
4.3 系统功能架构 34
4.3.1系统功能组成 34
4.3.2账号管理模块功能组成 35
4.3.3股票数据管理模块功能组成 35
4.4 股票行情波动趋势分析过程 35
4.4.1数据的采集和预处理 35
4.4.2训练网络的设计 36
4.4.3决策树分类设计 38
4.5 本章小结 40
第5章 股票行情波动趋势分析系统的实现 41
5.1 系统平台的搭建 41
5.2 数据的预训练和测试 43
5.2.1样本的选择 43
5.2.2训练阶段 44
5.2.3预测阶段 45
5.2.4决策树建立 46
5.3 预测结果 50
5.4 对预测结果的分析 55
5.5 本章小结 56
总结与展望 57
参考文献 58
致 谢 63
第1章 绪论
1.1 研究背景与意义
现代行业的发展,使得股票走进了普通大众的生活,成为了人们最常用的理财方式之一。但是,想要做好股票投资并不是那么容易,人们投资股票都希望能够在风险可控的情况下获得最大的收益。而想要达到这一目标,必须在对股票运行规律及其投资技术有深刻了解的基础上,对股票走势进行合理深入的分析,避免盲目投资,才能提高投资的回报率[1]。想要通过股票投资进行理财,必须学习股票分析技术,因此股票分析这项工作在股票投资过程中占据着举足轻重的地位。
总结与展望
基于神经网络的股票预测系统是一个集证券知识、人工智能、软件工程开发及应用于一体的综合系统。
在系统的研发过程当中,完成了开发、编程、调试等重要工作,并完成了规定的基本功能,同时结合Matlab语言的神经网络工具箱,完成了对股票的预测实验。总体来说,本系统的开发和研制立足于实用角度、直观易懂、方便使用、有较强的使用价值。
当然本系统还有许多需要改进和完善的地方,总结为以下三个方面:
第一,在本系统当中,采用了网络结构的优化和BP算法的方法,它对于一般前馈型学习可能会导致效率低下,甚至失败,因此可能会出现拟合效果差的现象发生。因此建议釆用二层以上的网络方式,并改变隐层节点的数目可以进行多次实验,最终找出效果较好的网络结构。
第二,本系统在处理大量数据的过程中,可能会产生两个重要问题:第一就是速度慢,第二就是拟合过度。为了排除这些问题,可通过数据预处理的方法来避免。
第三,由于本系统采用了C/S模式,应用程序在运行的过程中,数据存放在matlab文本格式的文件中,应用程序运行时需要以字符串的形式来完成数据的传输,从而降低了程序的执行效率,给本系统的使用带来了一定的不便。
针对以上三个问题,需要对系统做相应的调整和改进。考虑到我们的系统研发所涉及的领域比较多,在实际效果上,还是会有一定的偏差,为了有效地解决这些问题,今后还有很长的一段路要走,这也激励我们在以后的工作和学习当中继续努力。
参考文献
[1] 曹小春,曾安,潘丹. 云计算环境下面向领域的数据挖掘服务平台研究[J]. 自动化仪表,2014,09:9-13.
[2] 曹正凤,纪宏,谢邦昌. 使用随机森林算法实现优质股票的选择[J]. 首都经济贸易大学学报,2014,02:21-27.
[3] Xin-nan Zhao,Hong-chan Feng. Application of Data Mining Technology in the Enterprise Salary Design[A]. Information Engineering Research Institute,USA.Proceedings of 2014 4th International Conference on Applied Social Science(ICASS 2014) Volume 51[C].Information Engineering Research Institute,USA:,2014:5.
[4] 曹正凤. 随机森林算法优化研究[D].首都经济贸易大学,2014.
[5] 曾安,陈云,潘丹,杨海东,谢光强. 面向领域的数据挖掘云平台研究[J]. 微电子学与计算机,2014,08:15-19.
[6] 曾珂. 基于数据挖掘的微博用户兴趣群体发现与分类[D].华中师范大学,2014.
[7] 常凯. 基于神经网络的数据挖掘分类算法比较和分析研究[D].安徽大学,2014.
[8] Xin-nan Zhao,Hong-chan Feng. Application of Data Mining Technology in the Enterprise Salary Design[A]. Information Engineering Research Institute,USA.Proceedings of 2014 4th International Conference on Applied Social Science(ICASS 2014) Volume 51[C].Information Engineering Research Institute,USA:,2014:5.
[9] 陈宝钢. 基于数据挖掘方法的企业财务分析系统设计与实现[D].吉林大学,2014.
[10] Emanuel Raschi,Elisabetta Poluzzi,Ariola Koci,Paolo Caraceni,Fabrizio De Ponti. Assessing liver injury associated with antimycotics:Concise literature review and clues from data mining of the FAERS database[J]. World Journal of Hepatology,2014,08:601-612.
[11] 陈欣然. 基于数据挖掘技术的近15年反流性食管炎中医临床期刊文献研究[D].北京中医药大学,2014.
[12] 陈怡. 基于网络数据挖掘的移动视频客户数据支撑体系[J]. 信息通信,2014,01:161-163.
[13] 何清,庄福振,曾立,赵卫中,谭庆. PDMiner:基于云计算的并行分布式数据挖掘工具平台[J]. 中国科学:信息科学,2014,07:871-885.
[14] LIU TianHui,FU BiNa,ZHANG Dong H. Six-dimensional potential energy surface of the dissociative chemisorption of HCl on Au(111) using neural networks[J]. Science China(Chemistry),2014,01:147-155.
[15] 何晓旭. 时间序列数据挖掘若干关键问题研究[D].中国科学技术大学,2014.
[16] 黄佳彬. 数据挖掘在实践教学信息网中的研究与应用[D].北方工业大学,2014.
[17] Rennie Kaunda. New artificial neural networks for true triaxial stress state analysis and demonstration of intermediate principal stress effects on intact rock strength[J]. Journal of Rock Mechanics and Geotechnical Engineering,2014,04:338-347.
[18] 黄玲. 在电子商务中应用Web数据挖掘的研究[D].湖南大学,2014.
[19] 吉根林,赵斌. 面向大数据的时空数据挖掘综述[J]. 南京师大学报(自然科学版),2014,01:1-7.
[20] 荆月敏. 基于数据挖掘的图书馆书目推荐服务的研究[D].中北大学,2014.
[21] 李海林. 大数据环境下的数据挖掘课程教学探索[J]. 计算机时代,2014,02:54-55.
[22] LIU YanJun,LIU Lei,TONG ShaoCheng. Adaptive neural network tracking design for a class of uncertain nonlinear discrete-time systems with dead-zone[J]. Science China(Information Sciences),2014,03:276-287.
[23] 李平荣. 大数据时代的数据挖掘技术与应用[J]. 重庆三峡学院学报,2014,03:45-47.
[24] Emanuel Raschi,Elisabetta Poluzzi,Ariola Koci,Paolo Caraceni,Fabrizio De Ponti. Assessing liver injury associated with antimycotics:Concise literature review and clues from data mining of the FAERS database[J]. World Journal of Hepatology,2014,08:601-612.
[25] LI DongJuan. Adaptive neural network control for a class of continuous stirred tank reactor systems[J]. Science China(Information Sciences),2014,10:246-253.
[26] 李永红. 相关子空间中的局部离群数据挖掘及应用[D].太原科技大学,2014.
[27] 刘昱岗,安冬冬. 数据挖掘在公交调查数据分析中的应用研究[J]. 公路工程,2014,02:96-101.
[28] Hongmei Ni,Xuming Yang,Chengquan Fang,Yingying Guo,Mingyue Xu,Yumin He. Data mining-based study on sub-mentally healthy state among residents in eight provinces and cities in China[J]. Journal of Traditional Chinese Medicine,2014,04:511-517.
[29] Hongmei Ni,Xuming Yang,Chengquan Fang,Yingying Guo,Mingyue Xu,Yumin He. Data mining-based study on sub-mentally healthy state among residents in eight provinces and cities in China[J]. Journal of Traditional Chinese Medicine,2014,04:511-517.
[30] 刘智龙. 统计行业数据分析与数据挖掘应用——工具篇[J]. 统计与咨询,2014,01:36-38.
[31] 马宏斌,王柯,马团学. 大数据时代的空间数据挖掘综述[J]. 测绘与空间地理信息,2014,07:19-22.
[32] 屈莉莉,陈燕. 大数据背景下数据挖掘课程的教学改革与探索[J]. 教育教学论坛,2014,16:57-58.
[33] 孙二娟. 基于隐私保护的数据挖掘技术与研究[D].浙江理工大学,2014.
[34] 陶相宜. 基于数据挖掘的朱仁康从“风”论治皮肤病学术思想及临床经验研究[D].北京中医药大学,2014.
[35] 陶雨雨. 决策树及神经网络算法在股票分类预测中的应用[D].杭州电子科技大学,2014.
[36] 王明星. 数据挖掘算法优化研究与应用[D].安徽大学,2014.
[37] 王云峰,宁晓希. 刑侦数据仓库模型设计与数据挖掘技术应用[J]. 软件工程师,2014,06:53-55.
[38] Fei HE,Dong-feng HE,An-jun XU,Hong-bing WANG,Nai-yuan TIAN. Hybrid Model of Molten Steel Temperature Prediction Based on Ladle Heat Status and Artificial Neural Network[J]. Journal of Iron and Steel Research(International),2014,02:181-190.
[39] 吴汉华. 大数据时代中如何进行医疗数据挖掘与利用[J]. 硅谷,2014,05:13+12.
[40] 吴乔. 基于数据挖掘的煤炭企业成本管理系统的设计与实现[D].厦门大学,2014.
[41] 谢立阳. 基于海量数据挖掘的武汉城市圈应急物流系统的设计与优化[D].湖北工业大学,2014.
[42] 熊平,朱天清,王晓峰. 差分隐私保护及其应用[J]. 计算机学报,2014,01:101-122.
[43] 徐健锋,张远健,Zhou Duanning,Li Dan,李宇. 基于粒计算的不确定性时间序列建模及其聚类[J]. 南京大学学报(自然科学),2014,01:86-94.
[44] 许芳芳,丁雷道. 浅谈数据挖掘技术及其相关问题解析[J]. 数字技术与应用,2014,04:141-144.
[45] 闫燕. 数据挖掘在中国的现状和发展分析[J]. 科技信息,2014,05:292.
[46] 张晶晶. 数据挖掘在车险客户关系管理中的应用研究[D].大连海事大学,2014.
[47] 张雅. 面向铁路货运市场营销的数据挖掘技术应用研究[D].西南交通大学,2014.
[48] Masoud RAKHSHKHORSHID,Sayyed-Amin TEIMOURI SENDESI. Bayesian Regularization Neural Networks for Prediction of Austenite Formation Temperatures(A_(c1) and A_(c3))[J]. Journal of Iron and Steel Research(International),2014,02:246-251.
[49] 张艳. 大数据背景下的数据挖掘课程教学新思考[J]. 计算机时代,2014,04:59-61.
[50] 郑细端. Oracle数据挖掘在城市能源计量数据平台的应用[J]. 计算机与数字工程,2014,07:1299-1302.
[51] 周超群. 基于数据挖掘算法的教务选课系统的设计与实现[D].西安工业大学,2014.
[52] 周金革. 基于消错理论的数据挖掘错误系统优化方法及应用研究[D].广东工业大学,2014.