
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
6.1 数据粒化
数据粒化是基于粒计算的数据分析的基础,它是问题求解空间的一个构造性过程。数据粒化可以简单理解为在给定粒化准则下得到一个粒空间的过程,是粒计算基础单元的构建过程,包括数据粒、粒度空间、多粒度结构。根据不同的数据建模目标和用户需求可以得到多个粒度空间,进而得到不同的多粒度结构(如层次结构、多视角结构)。单纯依赖数据的粒化策略大多可以归结为基于二元关系的粒化策略,其本质是将满足预先定义的二元关系的两个数据样本分配到同一个数据粒中。基于聚类的粒化策略尽管本质上也依赖于二元关系,但它是在目标函数引导下,通过一个迭代寻优过程学习得到隐含于数据中的簇团结构。