查看“︁BIRCH”︁的源代码
←
BIRCH
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{机器学习导航栏}} '''BIRCH'''(英文全称:balanced iterative reducing and clustering using hierarchies,中文:'''利用层次方法的平衡迭代规约和聚类''')<ref>{{Cite journal|title=基于连通距离和连通强度的BIRCH改进算法|author=樊仲欣;王兴;苗春生;|url=http://kns.cnki.net/KCMS/detail/51.1307.TP.20181116.1353.022.html|journal=计算机应用|issue=|doi=|others=|year=2018|volume=|page=6|pmid=|access-date=2018-12-09|archive-date=2019-02-15|archive-url=https://web.archive.org/web/20190215144702/http://kns.cnki.net/KCMS/detail/51.1307.TP.20181116.1353.022.html|dead-url=no}}</ref>是一个[[非監督式學習|非监督式]][[聚类分析|分层聚类算法]],于1996年由 Tian Zhang 提出。算法的优势在于能够利用有限的内存资源完成对大数据集的高质量的聚类。<ref>{{Cite web|url=https://blog.csdn.net/qll125596718/article/details/6895291|title=BIRCH算法学习 - Liam Q的专栏 - CSDN博客|accessdate=2018-12-09|work=blog.csdn.net|archive-date=2019-02-15|archive-url=https://web.archive.org/web/20190215144701/https://blog.csdn.net/qll125596718/article/details/6895291|dead-url=no}}</ref>该算法通过构建聚类特征树(Clustering Feature Tree,简称CF Tree),在接下来的聚类过程中,直接对聚类特征进行聚类,而无需对原始数据集进行聚类。<ref>{{Cite journal|title=BIRCH聚类算法优化及并行化研究|url=http://www.cnki.net/kcms/doi/10.16208/j.issn1000-7024.2007.18.014.html|last=朱|first=映辉|last2=江|first2=玉珍|date=2007|journal=计算机工程与设计|issue=18|doi=10.16208/j.issn1000-7024.2007.18.014|pages=4345–4346+4369|issn=1000-7024|access-date=2018-12-11|archive-date=2019-02-15|archive-url=https://web.archive.org/web/20190215144701/http://www.cnki.net/kcms/doi/10.16208/j.issn1000-7024.2007.18.014.html|dead-url=no}}</ref>因此在多数情况下只需要扫描一次[[数据库]]即可进行聚类,IO成本与数据集尺寸呈线性关系。<ref>{{Cite web|url=https://www.cnblogs.com/pinard/p/6179132.html|title=BIRCH聚类算法原理 - 刘建平Pinard - 博客园|accessdate=2018-12-09|work=www.cnblogs.com|language=zh-cn|archive-date=2018-12-24|archive-url=https://web.archive.org/web/20181224003749/http://www.cnblogs.com/pinard/p/6179132.html|dead-url=no}}</ref> == 聚类特征树 == 算法利用构建聚类特征树进行计算,树上的节点称作'''聚类特征'''(<math>CF</math>)。 聚类特征为一个三维[[向量]]<math>(n, LS, SS)</math><ref>{{Cite web|url=https://blog.csdn.net/Androidlushangderen/article/details/43532111|title=BIRCH算法---使用聚类特征树的多阶段算法 - 走在前往架构师的路上 - CSDN博客|accessdate=2018-12-09|work=blog.csdn.net|archive-date=2019-02-15|archive-url=https://web.archive.org/web/20190215144701/https://blog.csdn.net/Androidlushangderen/article/details/43532111|dead-url=no}}</ref>,<math>n</math>表示子类中节点的数目,<math>LS</math>表示<math>n</math>个点的线性和,<math>SS</math>表示<math>n</math>个点的平方和。 == 参考资料 == {{reflist}} [[Category:数据挖掘]] [[Category:聚类分析]] [[Category:机器学习]]
该页面使用的模板:
Template:Cite journal
(
查看源代码
)
Template:Cite web
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:机器学习导航栏
(
查看源代码
)
返回
BIRCH
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息