自学机器学习的误区和陷阱不要把深度学习作为入门( 二 )


3. 机器学习课程3.1. 第一阶段:基础介绍(3-6 个月)
入门的第一步是学习一些经典课程和支持经典书籍 。一般来说,这个过程在半年内比较合适 。我在本节介绍的课程和书籍难度很低,不需要太多的数学或编程 。
3.1.1.吴恩达机器学习课程
Ng 的机器学习课程 ( | ) 是许多人的入门课程,难度适中且完全免费 。网站上共有49285人打分,平均分4.9分,满分5分 。据我个人观察,大部分课程评分在4-4.5分之间,而能达到4.9分的课程也很少 。还有一点值得关注的是,这门课有近5万人给评分,统计知识告诉我们这个样本很大,所以评分应该接近真实值,这样比较可信 。据统计,该课程是所有在线课程中最受欢迎的课程 。另一个更直接的观察是,如果您搜索“如何开始使用机器学习?”在知乎上,大部分答案都提到了这个入门课程,所以这是一个绝对的口碑课程 。详细讨论请参考:微调:为什么中国人对吴恩达的机器学习课如此痴迷? .
3.1.2. 机器学习与 R
在学习吴恩达的在线课程时,建议阅读相关机器学习书籍,补充理论知识 。再次推荐这两本很好的入门书,我的专栏里也有这两本书的介绍 。
3.1.3.周志华,《机器学习》
先生 。周志华的《机器学习》也被亲切地称为《西瓜书》 。虽然只有几百页,但内容却很丰富 。然而,与其他人不同的是,我推荐将西瓜书作为参考书,而不是主要读物 。由于篇幅所限,西瓜书涵盖了很多内容,但无法详细查看 。初学者自己阅读是非常困难的 。本书更适合中级读者作为学校教材或自学使用 。入门时学习这本书会稍微困难一些 。
我个人的建议是在学习网课和阅读ISL遇到疑惑的时候可以参考西瓜书的相关章节,但是在入门阶段没有必要逐章阅读 。建议在这个阶段只阅读前十章 。可以 。
3.2. 第二阶段:高级学习(3-6 个月)
在这个阶段,您对机器学习有了基本的了解 。如果你认真阅读过ISL并完成了 Ng的课程,相信你对什么是线性回归、什么是数据压缩有一定的理论理解,并对特征工程和简单的回归/预测问题有一定的理论基础 。练习最重要!
3.2.1. 挑战/练习
(Your Home for Data)在数据分析领域早有名气,甚至可以说是数据分析第一社区 。它刚刚被谷歌收购 。网站上有很多很好的数据集和挑战,你可以尝试这些挑战来获得名额,甚至获得奖品,这对以后的求职也很有帮助 。还有一个很大的好处就是网友们会分享他们的经验和意见,你也可以提出问题,请他们帮助你想出一些更正 。
国内也有类似的平台,比如天池大数据大赛等类似的平台 。
使用的主要目的是为了修炼技能,防止他们修炼屠龙技能 。机器学习最大的错觉,就是以为自己什么都懂,但实际使用时,却发现它不起作用,而是一个低成本应用机器学习的机会 。
3.2.2. 文档学习
(-learn: in ) 是市场上最流行的机器学习/数据科学工具包,API 在上述书中被大量使用 。与使用目的一致,学习文档也是一个实践过程 。推荐的方法是查看所有主流机器学习模型中的示例 。
该文档是为数不多的像教程一样编写的技术文档之一,非常值得阅读 。举个简单的例子,如果你想学习使用逻辑回归,可以参考:3-class
自学机器学习的误区和陷阱不要把深度学习作为入门
文档
不仅提供运动数据、相关代码示例,还提供可视化 。
结合 -learn,我建议参考这本 19 年的书 。是我看过的少数几本理论与实践相结合的书之一,尤其是代码部分!


以上关于本文的内容,仅作参考!温馨提示:如遇专业性较强的问题(如:疾病、健康、理财等),还请咨询专业人士给予相关指导!

「辽宁龙网」www.liaoninglong.com小编还为您精选了以下内容,希望对您有所帮助: