上的股票数据,我接下来的研究就准备以这十万个左右的典样本据为基础。
我的想法说起来很简单,就是要从这些看似杂乱无章的数据当中构建出能够预测股票涨跌的数学模型,然后以此模型来指导股票的投资活动。不过什么事情都是说起来简单,真正要做起来却并容易。我现在正在做的工作就是利用数理统计和聚类分析的知识,对样本数据进行粗略的分类,为进一步的分析和研究做准备。在这个过程完成之后,接下来我要做的工作就是要从看起来毫不相关的数据当中找出共性规律,用专业术语来说就是要找出数据模式datapatte或者干脆把整个过程称为模式分类pattecssification,这是最困难、也是最关键的一步;如果能够这步能够很好的完成,那接下来建立数学模型和利用模型来预测股票走势也就是顺理成章的事情了。
听起来好像是有些罗嗦,不过搞计算机的人应该一眼能够看出,我所做的工作其实就是所谓的「数据挖掘」dataining,而且是属于时间序列数据挖掘或称时序分析。
也许有人会对我的想法嗤之以鼻,因为股市是随机的,没有任何的规律可循。这种说法有一定道理,但是却是似是而非,因为随机并不就等于没