Rough Set(粗糙集)

粗糙集

粗糙集介绍

粗糙集理论是一种研究不精确,不确定性知识的数学工具,其基本思想是在保持分类能力不变的前提下,
通过知识约简,导出概念的分类规则。粗糙集理论的知识表达方式一般采用信息表或称为信息系统的形式,
它可以表现为四元有序组D=(𝑈,𝐴,𝑉,𝐹)。其中U为对象的全体,即论域;𝐴是属性全体;𝑉是属性的值域;
𝐹为一个信息函数,反映了对象𝑥在𝐷中的完全信息。

粗糙集可以处理以下问题

1、不确定或不精确知识的表达;
2、经验学习并从经验中获取知识;
3、不一致信息的分析;
4、根据不确定,不完整的知识进行推理;
5、在保留信息的前提下进行数据化简;
6、识别并评估数据之间的依赖关系。

等价关系

如果R是集合A上的关系,则满足以下条件:
    a.自反性,设R是集合A到A的二元关系,如果对任意a∈A,有(a,a)∈R,
    则称R是A上的自反关系;
    b.对称性,设R是集合A上的二元关系,如果对任意a,b∈A,有(a,b)∈R,
    也必有(b,a)∈R,则称R是A上的对称关系;
    c.传递性,设R是集合A上的二元关系,如果对任意a,b,c∈A,如果无论什么时候有
    (a,b)∈R和(b,c)∈R,必有(a,c)∈R,则称R是A上的传递关系。

等价类

设R是A上的一个等价关系,与A中一个元素a相关的所有元素的集合被称做a的一个等价类[a]R.
当仅考虑一个关系是时,可以省去下标,而简写成[a].形式地,[a]R={s|(a,s)∈R}

不可分辨关系

设属性集𝑃⊆𝑅,对象𝑋,𝑌∈𝑈,对于每个𝑎∈𝑃,当且仅当𝑎(𝑋)=𝑎(𝑌)时,
𝑋和𝑌是不可分辨的,称属性集𝑃是不可分辨关系(𝐼𝑛𝑑𝑖𝑠𝑐𝑒𝑟𝑛𝑖𝑏𝑖𝑙𝑖𝑡𝑦 𝑅𝑒𝑙𝑎𝑡𝑖𝑜𝑛),
即有:IND(P)={(X,Y)∈U:∀a∈P,a(X)=a(Y)}
如在一堆气球中,按照每个气球的颜色分为{红色},{蓝色},{白色}等,则颜色就是不可分辨关系。

上下近似

Snipaste_2018-11-25_16-22-28.png
图片1.png
Snipaste_2018-11-25_16-21-57.png

属性约简

Snipaste_2018-11-25_16-26-10.png
未命名图片.png

由此例可知:当去掉条件属性中的冗余属性时,不会对原有的不可分辨集合产生影响时,这样的操作便是属性约简。即,C_2 是C的属性约简。