计算机科学
主办单位:国家科学技术部
国际刊号:1002-137X
国内刊号:50-1075/TP
学术数据库优秀期刊 《中文科技期刊数据库》来源期刊
       首 页   |   期刊介绍   |   新闻公告   |   征稿要求   |   期刊订阅   |   留言板   |   联系我们   
  本站业务
  在线期刊
      最新录用
      期刊简明目录
      本刊论文精选
      过刊浏览
      论文下载排行
      论文点击排行
      
 

访问统计

访问总数:42218 人次
 
    本刊论文
机器学习中的密度比估计

  随着大数据时代的到来,机器学习和数据挖掘技术已经成为目前计算机科学领域的热门研究课题。而机器学习可以说是计算机领域内交叉性极强的一项技术,它融合了统计学与概率论、最优化理论、计算理论等数学领域的相关理论,借鉴了统计物理学中的相关思想,甚至还借鉴了生物学中关于神经元工作机理,可谓是博采众长。也正因为所涉及领域的庞杂性,使得初学者很难从整体上把握其全貌。日本研究者Sugiyama最近几年提出了一个新颖的视角,即将机器学习中的大部分问题纳入到密度比(测度概率密度与训练概率密度的比值)估计的理论框架中。由于密度比是一个相对较容易理解的概念,作者从这个概念出发对机器学习中的经典问题进行了梳理,从而为学习者理解机器学习提供了新的理解框架。


  全书分为5个部分,共17章。第1部分是概述,含第1章:机器学习中密度比估计的作用。第2部分介绍了密度比估计的方法,含第2-8章:2.密度比估计的各类方法;3.介绍了矩匹配;4.介绍了概率化分类;5.介绍了密度拟合;6.介绍了密度比拟合;7.介绍了一个统一的密度比估计和拟合的框架;8.介绍了在高维情况中通过维度约减对密度比直接估计的方法。第3部分介绍了密度比估计在机器学习中的应用,含第9-12章:9.介绍了重要度采样;10.介绍了分布比较;11.介绍了互信息估计;12.介绍了条件概率估计。第4部分对密度比估计进行了理论分析,含第13-16章:13.介绍了参数化收敛分析;14.介绍了非参数化收敛分析;15.介绍了参数化两样本检测;16.介绍了非参数化数值稳定性分析。最后第5部分进行了总结并对未来研究进行了展望。


  本书的第1作者是日本东京工业大学计算机科学系的副教授,第2作者是日本东京大学数理信息科学系助理教授,第3作者是日本名古屋大学计算机和数理信息科学副教授。本书对机器学习的相关理论和问题提出了一种非常新颖的理解视角,并给出了一致性的解决框架。Sugiyama教授在机器学习领域非常活跃,他所著的另一本书《Machine Learning In NonStationary Environments》于2012年由麻省理工出版社出版,该书与本书也有一定的相关性。本书非常适合对机器学习感兴趣的研究和工程人员阅读参考。


  张志斌,副研究员


  (中国科学院计算技术研究所)


特别说明:本站仅协助已授权的杂志社进行在线杂志订阅,非《计算机科学》杂志官网,直投的朋友请联系杂志社。
版权所有 © 2009-2024《计算机科学》编辑部  (权威发表网)   苏ICP备20026650号-8