机器学习工程师纳米学位学习点滴

从2019年4月至2019年7月底,四个月的时间,完成了udacity的机器学习纳米学位的所有视频和编程课程,在此做一下简单的小结。

首先,花费的时间比预期的短,在上篇中,我预算是九月底学完,提前了2个月就完成了该学位的学习。在学习的四个月中,基本上每周会花费至少3个晚上学习课程视频和编程练习。

通过课程的学习,对机器学习有了一个更加全面的了解。

在监督学习课程中,理解了数据集分为训练集测试集和交叉验证集,过拟合和欠拟合的情况以及如何避免;梯度下降;决策树中熵的计算以及如何熵增最大进行分类的理论,随机森林的概念;朴素贝叶斯中先验概率和后验概率的计算;支持向量机中分类误差和边际误差;最后是bagging和AdaBoost的理论和计算。

在非监督学习课程中,首先学习了不同的聚类,k-means、层次聚类、密度聚类(DBSCAN)以及高斯混合模型聚类(GMM),对其应用方向有简单的了解;然后学习了PCA主成分分析以及ICA的原理与应用。

最后是深度学习的内容,了解了one-hot编码,不同的激活函数,前向传播和后向传播计算;防止过拟合的方式以及一些优化技巧;学习了CNN卷积神经网络,了解了卷积核和池化层等内容。有一节的强化学习内容,没有学习。

可以说udacity的机器学习纳米学位工程师的课程设置内容很充实,可以全面的了解机器学习的内容,使自己有个入门的初级认识吧。自己也跟随课程完成了一些编程练习,完成了使用决策树分析Titanic的生存率,预测波士顿房价;使用朴素贝叶斯建立垃圾邮件分类模型;使用Keras分析IMDB数据等。通过为期四个月的业余时间学习,基本上对机器学习有了认识,以后具体要研究哪个方向再具体深入学习,毕竟机器学习的算法和应用方向非常多,不可能对所有知识点和机器学习算法都了如指掌运筹帷幄。

接下来,按照计划,我会学习机器视觉纳米学位 Computer Vision Nanodegree,有一定的难度和挑战性,预计在今年12月底学完。

 

二赛君

2019年8月21日

留下评论