统计与数据科学学院 报道
近日,我校统计与数据科学学院博士生任阳完成的学术论文“Spectral Clustering for Functional Data with Asymptotic Properties”以南京审计大学为第一署名单位被统计学权威期刊Statistica Sinica接收。论文指导教师为我校统计与数据科学学院林金官教授,王江艳副教授与加拿大滑铁卢大学桑培俊副教授。

传统聚类方法主要是针对多元数据开发的,往往难以捕捉函数型数据的连续性与动态性,进而忽略了关键特征。针对这一问题,该论文提出一种两阶段函数型数据谱聚类(TSFDSC)方法,该方法可借助图拉普拉斯算子,有效实现对稠密型和稀疏型函数数据的聚类。对于稠密函数型数据,先将其投影至一组预设的基函数上,再对投影得到的系数进行谱聚类;对于稀疏函数型数据,则改用函数主成分得分开展聚类。通过利用谱嵌入生成的低维表征,该方法实现了计算效率的提升。论文推导并证明了所提方法的渐近性质。仿真实验结果表明,在多种实验设定下,TSFDSC的性能均优于一些常用的函数型聚类方法。最后,通过两个实际应用案例,进一步验证了该方法的有效性。



联系我们