数据挖掘在电子商务中应用问题研究_张冬青

数据挖掘在电子商务中应用问题研究

数据挖掘在电子商务中应用问题研究

张冬青

(黑龙江大学信息管理学院,哈尔滨150080)

统计方法

常见的如抽样技术,面对海量的需要处理的数据,对

所有的数据进行分析是不可能的也是没有必要的,这就要

在理论的指导下进行合理的抽样。然后进行例如多元统计

分析,因子分析,聚类分析,回归分析,时间序列分析等。

2.2 可视化技术

用图表等方式把数据特征直观地表述出来,如直方图

等,这其中运用的许多描述统计的方法。可视化技术面对

的一个难题是高维数据的可视化。

2.3 决策树

利用一系列规则划分,建立树状图,可用于分类和预

测。常用的算法有CART、CHAID、ID3、C4.5、C5.0等。

2.4 神经网络

模拟人的神经元功能,经过输入层、隐藏层、输出层

等,对数据进行调整、计算,最后得到结果,用于分类和

回归。

2.5 遗传算法

基于自然进化理论,模拟基因联合、突变、选择等过

程的一种优化技术。

2.6 关联规则挖掘算法

关联规则是描述数据之间存在关系的规则,形式为

“A1∧A2∧ An※B1∧B2∧ Bn”。一般分为两个步骤:第

一步,求出大数据项集。第二步,用大数据项集产生关联

规则。

除了上述的常用方法外,还有粗集方法,模糊集合方

法,Bayesian Belief Netords,最邻近算法(k-nearest neigh-

bors method(kNN))等。

3 国内外数据挖掘技术的发展概况

随着KDD在学术界和工业界的影响越来越大,国际

KDD组委会于1995年把专题讨论会更名为国际会议,在加

拿大蒙特利尔市召开了第一届KDD国际学术会议,以后每

年召开一次。近年来,KDD在研究和应用方面发展迅速,

尤其是在商业和银行领域的应用比研究的发展速度还要快。

目前,国外数据挖掘的发展趋势及研究方向主要有:

3.1 对知识发现方法的研究进一步发展,如近年来注重对

Bayes(贝叶斯)方法以及Boosting方法的研究和提高。

数据挖掘在电子商务中应用问题研究_张冬青相关文档

最新文档

返回顶部