工学博士、副教授撰写的人工智能稀有书籍清单,并附有 PDF 版本的链接。
机器学习
在机器学习方面,我首先要推荐的两本书是李航博士的《统计学习方法》和周志华教授的《机器学习》。
《统计学习方法》采用“一般-具体-一般”的结构,在梳理统计学习的基本概念后,系统全面地介绍了统计学习中的10种主要方法,最后对这些算法进行了总结和比较。本书以数学公式为主,在介绍每种方法时,都给出了详细的数学推导,几乎没有废话,因此对读者的数学功底要求也很高。
相比之下,《机器学习》涵盖的范围更广,入门性更强,有助于了解机器学习的全貌。书中几乎涵盖了机器学习中所有算法类别的基本思想、适用范围、优缺点、主要实现方法等,并穿插了大量通俗易懂的实例。
如果说《统计学习方法》胜在深度,那么《机器学习》胜在广度。鉴于它的广度,你可以在《机器学习》提供的丰富参考资料的基础上继续深入挖掘。
读完以上两本书,可以再读一些经典著作。第一本经典著作是 Tom Mitchell 的《Machine Learning》,中译本名为《机器学习》。这本书写于 1997 年,虽然难以涵盖机器学习的最新进展,但对基础理论和核心算法的讨论还是精辟的,毕竟经典理论经得起时间的考验。这本书的重点也是广度,没有涉及很多复杂的数学推导,是一本理想的入门书。作者曾在主页上表示,这本书将出新版本,并增加了一些章节,或许在未来两年内,我们就能期待新版本的面世。
另一本经典书籍是 Trevor Hastie 等人撰写的 Elements of Statistical Learning,2016 年出版了第二版。这本书没有中文翻译版,只有影印本。专家写的书不会用大量复杂的数学公式吓唬人(专门讲算法推导的书除外),这本书也不例外。它更强调各种学习方法的内涵和外延。相比于具体的推导,从方法的起源和发展来理解其应用场景和发展方向或许更为重要。
最后一本登上舞台的书是 Christopher Bishop 的《模式识别与机器学习》。这本书出版于 2007 年,至今没有中文译本。或许是因为翻译这样一本气势磅礴的书需要无数个深夜。这本书的特点是将机器学习视为一个整体,无论是基于频率的方法还是贝叶斯方法,无论是回归模型还是分类模型,都只是问题的不同方面。作者可以开拓出一个上帝视角,将各种机器学习纳入一张巨网。可惜的是,大多数读者跟不上他的高深思维(包括我自己)。
最后推荐的一本书是 David JC MacKay 的 Information Theory, Inference and Learning Algorithms,出版于 2003 年,中译本名为《信息论、推理与学习算法》。这本书的作者是一位多才多艺的科学家。这本书并不是一本机器学习的专著,而是将多个相关学科合二为一,内容相当广泛。相比于那些正面写着一张脸的教科书,阅读这本书感觉就像在和作者聊天,他会在谈话中抛出各种问题让你思考。话题的广泛性让这本书的阅读体验并不轻松,但可以作为一种拓展视野的方式。