请教在数据挖掘中数据平滑的分箱方法

温馨提示:本文有166个文字,大小约为1KB,预计阅读时间1分钟
【请教在数据挖掘中数据平滑的分箱方法】文章题目:请教在数据挖掘中数据平滑的分箱方法
分箱的方法主要有:
1.最小熵法
小知识
:在信息论中,熵是对不确定性的一种度量 。信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大 。
2.自定义区间法:自定义一个数值区间,用分类讨论的办法研究问题 。
3.统一区间法:与自定义区间法相对,多个问题研究共用一个区间 。
4.统一权重法:权重越大则该指标的重要性越高,对整体的影响就越高,反之亦然 。
数据平滑的方法主要有:
1.平均值法:求取平均值研究问题 。
2.中间值法:去数集或解集的中间值研究问题 。
3.边界值法:取数集或解集两段数或解研究问题 。

    推荐阅读