资料介绍
在数据挖掘领域中,通常以分类精度作为分类算法效果的评估标准。这一标准是建立在假设任意一实例被误分类为任意类时都具备同样代价的基础上的。当此假设不成立时,直接使用传统分类方法就无法取得良好的分类和预测效果。针对这一问题,通过改进编解码方法以及在适应度函数中集成样本的不同误分类代价,提出了一种基于基因表达式程序设计的代价敏感分类算法(CSC-GEP),并在三个UCI数据集上对该算法进行了测试,实验结果表明CSC-GEP是一种有效的代价敏感分类算法。
关 键 词 分类; 代价敏感; 误分类代价; 基因表达式程序设计
In data mining reseach, the classification algorithms generally pursue more highly accuracy. It is based on the assumption that all misclassifications have the same cost. However, the assumption is not correct in the real world, so that the normal classification algorithms do not perform well. By improving the encode/decode methods and taking different misclassification cost into account, this paper concerns a new cost-sensitive algorithm called CSC-GEP based on Gene Expression Programming (GEP). The experimental results show that the new algorithm is effective.
Key words classification; cost-sensitive; cost of misclassification; gene expression programming
在数据挖掘中,分类的任务通常是建立一个期望误分类数量最小的分类器,比较典型的例子如C4.5的决策树算法,在传统上都是基于分类错误具有相同的代价的假定上的。而在现实中,不同的分类错误通常会导致不同的代价。以UCI数据集中的Heart disease数据集为例,错误地将健康的人分类为患病的代价仅仅是使健康的人接受更多的检查,但如果将患病的人分类为健康,则有可能延误病人的治疗。很明显,第二种错误分类会令使用者付出远比第一种错误分类更大的代价。仍以Heart disease数据集为例,在这一数据集上建立分类器的目的是为了检测出患病的就诊者。对某一特定疾病而言,可能存在的情况是全部就诊者中仅有极少数是患病者,则在最糟糕的情况下,使用传统分类方法产生的分类器只需要牺牲全部患病者的实例作为误分类即可获得一个在传统意义上的高精度分类结果。但此时这个分类器也就丧失了存在的意义。因此在处理误分类代价不统一的数据集时,单纯地以分类精度作为分类器的评估标准就变得不恰当了。一种合理的解决方法是以代价敏感(Cost Sensitive Classification,CSC)的分类取代精度敏感的分类。
本文通过在GEP的适应度函数中加入代价矩阵,提出了基于基因表达式编程的代价敏感分类算法CSC-GEP。通过在UCI数据集中的Heart disease数据集、Sick数据集和Credit数据集上的分类算法与传统算法进行实验对比,结果证明CSC-GEP是一种有效的代价敏感分类算法。
- 缓存敏感的多属性不等值连接操作算法 5次下载
- 计算二类代价矩阵的通用计算公式 8次下载
- 基于机器人操作系统的代价地图自适应膨胀半径算法 6次下载
- 基于约束关键路径的代价优化调度算法 2次下载
- 基于直方图条件熵的水声数据分类算法 9次下载
- 一种基于BERT模型的社交电商文本分类算法 8次下载
- 最大化AUC关系的PU分类应用及相关算法 12次下载
- 集成WL-CNN和SL-Bi-LSTM的旅游问句文本分类算法 5次下载
- 结合BERT模型的中文文本分类算法 6次下载
- 如何使用跨尺度代价聚合实现改进立体匹配算法 10次下载
- 如何使用直方图条件熵实现水声数据分类的算法 22次下载
- 如何使用多线性分类器拟合实现攻击模拟算法 2次下载
- 新的基于代价敏感集成学习的非平衡数据集分类方法NIBoost 12次下载
- 分类规则挖掘算法综述
- 代价敏感支持向量机在垃圾邮件过滤中的应用
- 基于Python实现随机森林算法 1017次阅读
- 边缘计算计算卸载与资源分配联合优化算法 1033次阅读
- 常见排序算法分类 783次阅读
- 实现敏感薄膜的高性能化的主要途径 519次阅读
- 采用DSP芯片实现星敏感器运算电路系统的应用方案 5415次阅读
- 机器学习算法的技巧分享 4244次阅读
- 详解机器学习分类算法KNN 5930次阅读
- 图像分类的5种威廉希尔官方网站 ,总结并归纳算法、实现方式,并进行实验验证 7.3w次阅读
- 基于System Generator中实现算法的FPGA设计方案详解 1693次阅读
- 解决二分类问题的算法——AdaBoost算法 1.1w次阅读
- 基于FPGA的Cordic算法实现的设计与验证 2568次阅读
- 分水岭算法(理论+opencv实现) 8233次阅读
- 贝叶斯分类算法及其实现 7380次阅读
- 学习KNN算法的基本原理,并用Python实现该算法以及阐述其应用价值 5835次阅读
- 详细解析scikit-learn进行文本分类 4626次阅读
下载排行
本周
- 1电子电路原理第七版PDF电子教材免费下载
- 0.00 MB | 1490次下载 | 免费
- 2单片机典型实例介绍
- 18.19 MB | 93次下载 | 1 积分
- 3S7-200PLC编程实例详细资料
- 1.17 MB | 27次下载 | 1 积分
- 4笔记本电脑主板的元件识别和讲解说明
- 4.28 MB | 18次下载 | 4 积分
- 5开关电源原理及各功能电路详解
- 0.38 MB | 11次下载 | 免费
- 6100W短波放大电路图
- 0.05 MB | 4次下载 | 3 积分
- 7基于AT89C2051/4051单片机编程器的实验
- 0.11 MB | 4次下载 | 免费
- 8基于单片机的红外风扇遥控
- 0.23 MB | 3次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 2PADS 9.0 2009最新版 -下载
- 0.00 MB | 66304次下载 | 免费
- 3protel99下载protel99软件下载(中文版)
- 0.00 MB | 51209次下载 | 免费
- 4LabView 8.0 专业版下载 (3CD完整版)
- 0.00 MB | 51043次下载 | 免费
- 5555集成电路应用800例(新编版)
- 0.00 MB | 33562次下载 | 免费
- 6接口电路图大全
- 未知 | 30320次下载 | 免费
- 7Multisim 10下载Multisim 10 中文版
- 0.00 MB | 28588次下载 | 免费
- 8开关电源设计实例指南
- 未知 | 21539次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935053次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537791次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420026次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191183次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183277次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138039次下载 | 免费
评论
查看更多