基于RBF神经网络对价值投资理念在中国股票市场的有效性研究

摘要:本文首先从价值投资理念的概念出发,介绍并分析了目前国内外学者对这类问题研究的情况,针对股票市场的非线性特征引入RBF神经网络概念。在接下来的实证分析部分,为了最大限度地减少实验分析的误差,选取沪、深股市中的百货商场行业作为研究对象,通过聚类分析并最终选取4家财务状况最接近的公司作为分析对象,借助神经网络理论中的RBF网络作为分析工具,通过对这几家公司的主要财务指标与财务指标公布后影响收盘价波动的平均值之间关系进行分析并验证,得出相关结论。

关键词:价值投资;聚类分析;RBF神经网络

1. 引言

随着我国股票市场的不断发展,越来越多的投资理念充斥着市场,成为投资者进行投资决策的依据,但其中的许多投资理念来自国外比较成熟的证券市场。这些理念对于中国的股票市场是否有效呢?本文试图运用RBF神经网络理论检验价值投资理念在中国股票市场的有效性。

1.1价值投资理念

价值投资理念,就是通过对股票内在价值的分析,与股票目前的价格相比较,从而决定买卖股票的一种投资理念。价值投资的实质就是通过对公司基本面的分析而采取相应投资策略的一种投资决策方法。

1.2 国内外研究动态

国外对价值投资理论研究的主要是对价值投资能否取得超额收益与超额收益的来源,而由于这一理念在国外提出的较早,并且价值投资的理念在实践中已被广大的投资者所接受并认可,甚至已经创造出惊人的成绩,所以,在国外,对价值投资理念在股票市场的有效性研究很少。

而在国内,对于价值投资理念在中国股市是否适用的问题上,形成了两种相反的观点。孙友群等人分析了我国的宏观经济状况和上市公司的微观状况,认为价值投资在中国股市具有极大的应用可能性和可行性。林斗志认为我国股市股票内在价值对股票价格的决定作用呈增强趋势,价值投资理念在市场中逐步形成,但市场还不够稳定,受非理性因素的冲击较大。但是同时也有部分学者认为价值投资理念在中国行不通。

本文利用神经网络这一研究非线性问题的工具来研究价值投资理念在中国股票市场的有效性问题。

2. 股票市场的非线性特征与RBF神经网络的适用性

2.1 股票市场的非线性特征

股票市场是一个混沌的市场,具有很强的非线性特征:(1)对影响股市波动相同的因素来说,根据其对股市造成影响的时间不同,每次该项因素对股市影响的程度也不同,这与线性系统的特征是不相符的,这也就说明了股票市场的非线性性。(2)股票市场波动的突发性和剧烈程度,足以说明股票市场的非线性性。

通过以上可以看出股票市场存在非线性的特征,利用一般的线性分析工具来研究股票市场对研究结果将会造成很大的偏差,但神经网络理论作为一种处理非线性问题的,以其自身的特点,可以很好的将其运用于解决此类问题。

2.2 RBF神经网络适用性

2.2.1 人工神经网络的特点

人工神经网络是由大量神经元的信息处理单元构成,其主要原理是模拟生物神经元之间的激励过程,通过这一复杂的过程来完成一系列的相关任务。神经网络具有以下显著特点:

(1)、具有自适应性,有强大的自主学习能力,可以通过训练样本并根据样本信息及周围环境变化改变自身的网络结构,从而使自身能够以最有效的形式来模拟训练样本所隐含的环境。

(2)、能从训练样本中获取知识,并具有很好的记忆特征,可以用于处理一些环境复杂,推理并不明确的问题。

(3)、在非线性时间序列预测中,人工神经网络实现了非线性关系的隐式表达,不需要建立复杂系统的显示关系式,这也就是说我们可以在不知道具体函数关系式的前提下运用人工神经网络进行预测。

(4)、神经网络的容错性强,可以处理信息不完全的预测问题。

(5)、由于神经网络具有一致逼近的能力,训练后的神经网络在样本点上输出期望值(误差在允许范围内),在非样本点上表现出神经网络的联想记忆功能。

2.2.2 RBF神经网络的原理

RBF是一种三层前向网络,包括输入层、隐含层和输出层,它的主要特点是隐含层神经元的输出函数是具有径向基对称的基函数。第一层为输入层,由大量输入数据组成,第二层为隐含层,隐含层由许多类似高斯函数的函数构成,对输入端进行加工,而输出层一般是简单的线性函数。

RBF网络一般采用Gause函数作为基函数,被定义为:

其中,Ci和σi(i=1,2,……n,n为隐含层节点个数)分别是隐含层第i个单元径向基函数中心和宽度。

由以上可知,神经元的权值Ci确定函数的中心,例如,当输入X与Ci重合时,函数输出达到最大值,当输入X距离Ci越远时,输出就越小。σi决定了函数的宽度,当σi越大,则输入X在远离Ci时衰减的速度就越快。Gause函数这样的结构也就意味着只有当输入接近RBF网络的接受域时,网络才会作出响应。

在RBF网络中,输入层至输出层所有权重固定为1,隐含层RBF网络的中心及半径通常是先确定,只有隐含层和输出层之间的权重值可调。RBF网络的隐含层执行一种固定不变的非线性变换,将输入空间的Rm映射到新的空间Rn,输出层在新的空间实现线性组合。这就是RBF网络的主要工作原理,其实质就是把在原来空间的非线性问题通过空间变换,转换成在一个新的空间里的线性问题。

由于RBF网络的这种组织结构以及其能够很好解决非线性问题等特征,决定了RBF网络不但具有一般神经网络可以以任意精度逼近任意函数这样的一个特点,而且,它还具有很强的聚类分析能力,这一点是本文之所以选用该网络研究股票市场有效性的原因所在。

3. 实证研究

3.1 数据的选取

本文选取了在我国沪市和深市上市的商业百货行业的企业作为研究对象,选取了该行业全部的26家上市公司,分别搜集它们2004年1季度到2010年1季度的各个季度的财务报表。

为了能对上市公司做出整体的价值评估,本文分别从五个方面对上市公司作出评价,包括从盈利能力、营运能力、成长能力、偿债能力和现金流量获取能力这五个方面做出评价。分别用净资产收益率来衡量企业的盈利能力,总资产周转率衡量企业的营运能力,净利润增长率衡量企业的成长能力,速动比率衡量企业的偿债能力,每股现金净流量衡量企业的现金获取能力。本文之所以选取这些数据作为研究对象基于以下几点原因:

首先,选取商品百货行业是由于该行业的上市公司在财务指标方面有较大的共性,各个公司的差距不是特别明显,这就有利于下面RBF网络对它们的处理,提高了研究的准确度。

其次,关于财务指标的选取方面我们除对现金流量的衡量外全部采用比率指标去衡量,这也就避免了因不同公司的规模大小有区别而产生较大的差异。而对于每股现金净流量这一指标,由于商品百货行业自身的经营特点,它们的现金流量一般相对于其它行业来说都是比较大,并且在该行业内由于上市公司的经营状况基本类似,该行业的现金流量的状况在很大程度上和整个国家的宏观经济状况有关,所以每股的现金净流量在该行业的上市公司之间差别不大。

以上所有财务数据均由新浪财经提供,对于获取的数据,我们进行相关整理,对由于不同原因缺失的相关数据利用插值法填充,保证数据的完整性,为进行下一步的分析做好基础。

3.2 数据的聚类分析

在利用RBF网络训练过程中,要求训练的数据量较大。一般来说,参加训练的数据量越大,所得到的训练后的网络模拟的效果就越好。所以,为了满足预测效果的要求,必须寻找多个公司作为训练样本,要求进行训练的上市公司的财务数据必须十分相似,这才能保证结果的准确度。为此,我们采取聚类分析的方法,从这26家公司当中选出相似程度最大的4家公司作为最终的研究样本。

通过利用SPSS统计软件,按照上述方法对这26家公司的每季度的5种财务指标和股票收盘价的均值进行聚类,其结果如图1所示:

从图1中可以看出,新世界、百联股份、南京新百、大连友谊这四家公司在第一步聚类的过程中就被归为同一类,所以它们的相似程度最大,并且这四家公司同属于国内二线城市的大型商业百货集团,可见我们聚类分析的结果是成功的。

3.3 RBF的网络训练

在研究中我们已获取的数据是根据聚类的结果得出的这四家公司的季度财务指标,还有我们根据计算所得到的这些上市公司每个季度股票收盘价的平均值,而我们的目标是利用训练好的网络对股票的价格进行预测。如果我们的预测值与实际值的误差在可以接受的范围之内,则说明利用财务数据对股票价格进行预测是可行的,也就说明了价值投资理念在我国股票市场是行之有效的;反之,则得出相反的结论。

根据我们已知的信息和需要解决的问题,我们分别把每个季度的5个财务指标作为网络的输入端,相对应的输出端为该公司下一个季度股票收盘价格的平均值,这样我们就做到了用当期的财务状况去判断该公司的股票价格对这些信息反应的有效性,并且利用了RBF网络的“黑箱型”这一功能,可以很好地模拟财务状况和股票价格这二者之间的关系。

在确定了最基本的输入与输出端之后,再来看一下调用RBF网络的函数,本文采用的是newrb(P,T,goal,spread,MN,DF),其中P代表输入,T代表输出,goal是为训练精度,也就是我们所允许的最大误差。为了使模拟的效果尽可能达到最好,本文设定为0.00001,spread为径向基层的散布常数,本文设定为4。而newrb这一函数的最大特点是可以根据所设定的训练精度,通过添加隐含层的神经元个数循环训练,直到训练的结果达到我们的要求为止,这是本文选取该函数最为重要的原因。

通过以上的说明,RBF的基本网络结构已经形成,利用已获取的85组数据作为我们的研究对象,从中随机挑选82组数据作为训练样本,剩余3组数据用于预测与检验。图2和图3就是我们的训练样本的情况。

由图2所示,纵轴表示对神经网络训练的误差精度,横轴表示网络中样本的数量,所以从图2中可以看出,对样本训练的结果达到了我们对训练精度的要求,训练后的网络误差在0.00001以下。由图3所示,横轴代表训练样本的个数(或者我们可以认为是训练样本的编号),纵轴代表训练样本的数值,其中绿色的圆圈代表的是每一个训练样本的实际值,而红色的线代表的是对神经网络进行训练后所得到的预测线(拟合曲线),从图中可以看出样本的真实值基本上都在拟合曲线上,所以网络的拟合效果较好,训练的结果满足我们的要求。在得到了训练好的神经网络之后,接下来所要做的就是对网络的具体运用,也就是利用神经网络对没有参与训练的样本进行预测。

4. 结论

利用随机抽取的三组数据进行预测,并将其预测值与实际值进行比较,结果如下表所示:

由上表可知,预测的误差在3%左右,这就说明了利用当期的财务指标去判断未来的股票走势是比较准确的,同时也显示出了价值投资理念对我国股票市场带来的重要意义:

首先,说明了价值投资理念对于我国的股票市场来说是有效的,即广大的投资者在可以根据上市公司公开的各种财务报表来判断这一个公司的投资价值,从而对自己的买卖行为进行决策。

其次,价值投资理念为广大的投资者提供了一个行之有效的投资方法,避免了投资者在投资于股票市场的盲目性。

最后,价值投资理念在我国股票市场的推行有利于我国股票市场的发展,进一步降低了我国股票市场的投机性,对形成一个真正稳定、有效的投资市场有着重要的意义。

参考文献:

[1]孙友群,陈小洋,魏非.价值投资与中国股市对接的思考[J]. 财经理论与实践,2002(2)

[2]林斗志.价值投资在我国股市表现的实证分析[J]. 财经科学,2004(1)

[3]李雪婷.论价值投资理论的原理及在中国股市的应用合理性分析[J].中国商界,2009(11)

[4]任秋娟.基于巴菲特投资理论的中国证券市场价值投资研究[J].现代商贸工业,2010(4)

[5]苑迪.基于动态神经网络的股价预测模型研究[D].湖南大学,2009

[6]庞素林.信用评价与股市预测模型研究及应用[M].北京:科学出版社,2005

本文为武汉理工大学自主创新研究基金《基于神经网络系统分析我国股票市场的有效性》课题(项目编号2010-ZY-JJ-007)的系列研究成果之一。

(作者单位:武汉理工大学经济学院武汉理工大学理学院)