7/23/2007
一款像模像样的数据挖掘软件—AlphaMiner
介绍一款免费的数据挖掘软件,就是左图所示的AlphaMiner,1.0版由香港大学电子商务研究所研制,现在它由该机构和哈尔滨工业大学(哈工大,叫全称怎么这么别扭)深圳研究生院联合成立的一个商务智能实验室共同开发维护,已经升级到2.0版。它自称是一个开源项目(的确开放源代码),但我现在看它在sourceforge的链接已经删掉,不知为什么。试着一句话介绍:
AlphaMiner是一款基于开源项目Weka和Xelopes的,跟主流数据挖掘平台如SAS Enterprise Miner、SPSS clementine、S-Plus Insightful Miner等拥有一样友好图形界面和工作流方式的,可以实施大多数常用数据挖掘算法的,免费的、可以定制中文界面的、像模像样的、开源的数据挖掘软件。
这里的关键词是“像模像样”,是跟上面提到的SAS Enterprise Miner、SPSS clementine、S-Plus Insightful Miner相比来说的,AlphaMiner小巧玲珑,安装文件(加上JRE)不到40M,图形界面、工作流方式,还有提供的众多数据挖掘算法,可谓麻雀虽小,五脏俱全,各方面真是像模像样,以下的特点都是来自2.0版:
- 图形界面,工作流方式,左边是带选择的节点,右边的大片空白就是工作簿,用来堆放从左边拖曳过来的各种节点,这样的工作环境跟SAS Enterprise Miner、SPSS clementine、S-Plus Insightful Miner等主流数据挖掘平台一模一样;
- 数据挖掘流程,遵循跟SPSS clementine一样的所谓CRISP工业标准(Cross Industry standard Process for Data Mining,CRISP-DM),即把一个数据挖掘项目的流程分为以下六个部分,体现在AlphaMiner界面左侧的选项就是Data Understanding、Data Preparation、Modeling、Evaluating和Evaluate:
- 理解业务(business understanding)
- 理解数据(data understanding)
- 数据准备(data preparation)
- 建模(modeling)
- 评估(evaluation)
- 实施(deployment)
- 算法,AlphaMiner提供包括分类、聚类和关联分析的共12种现成数据挖掘算法,其中,关联分析(Association)一种,聚类(Cluster)提供KMeans和WKMeans两种算法,分类(classification)算法有:
- 决策树(Decision Tree)
- 简单贝叶斯(Naive Bayes)
- 序贯最小优化(Sequential Minimal Optimization,SMO)
- 逻辑斯蒂回归(Logistic Regression)
- 线性回归(Linear Regression)
- 多层感知器(Multilayer Perception)
- 径向基网络(RBFNetwork)
- OneR,(以前是一个插件,用来生成规则)
- WekaClassifier(以前是一个插件,用来调用Weka的分类器)
AlphaMiner2.0的下载地址在:http://bi.hitsz.edu.cn/AlphaMiner/index.htm