admin 管理员组

文章数量: 1086019


2024年4月28日发(作者:structure and infrastructure engineering)

机器学习该怎么入门

简单来说,入门就是数学基础+编程,也可以学一些简单的算法,看一些数

据分析课程来提高数据处理能力等等。一些高难的算法可以等到入门后摸索着去

学习和理解,当然上来不建议直接读算法书,对于没有基础的小白来说简直就如

天书一般。首先,我认为最重要的就是学好数学,打好数学的基本功,这样看机

器学习里面那样复杂的公式才不会觉得头疼,学起来才不会觉得吃力。本科阶段

是数学的我可以给大家来推荐一些我觉得有必要去学习的数学知识:

总的来说,可以归纳为以下几方面的内容:

1、微积分

讲解之前先给大家介绍一下机器学习的概念,机器学习也被称为统计学习,

是关于计算机基于数据构建概率统计模型并运用模型对于数据进行预测与分析

的一门学科(到这里可以看出概率统计的学习很重要了,在第三部分我会详细讲

到)。

这个概念里面的构建模型,参加过数学建模比赛的伙伴们的应该会有所了

解,模型的构建大多是依赖于函数体系。微积分可以说是专门研究函数的一门学

科,比如说一元函数里面的极限,导数,泰勒公式,级数,多元函数里面的二重

积分,三重积分,曲线曲面积分等等,读到这里很多考研的小伙伴会发现这不就

是我每天做的高等数学题吗?没错,微积分可以说是高等数学的一个非常重要的

分支,机器学习里面所用到的数学知识基本上就是考研数学一二三的内容和难度

了。但是考研数学书更像是为考研考研而准备的一种应试类型的书,想学习更多

理论知识的话我给大家推荐华东师范大学数学系编写的《数学分析》,里面对于

知识点的讲解很全面很透彻。这也是很多高校数学专业所用的书籍,下面上图:

2、线性代数

线性代数这一部分对于考研的朋友们来说就更不陌生了,高数线代不分

家,那么在机器学习中,机器学习算法的输入输出结果往往是由向量和矩阵

的形式构成,下图可以详细地看到:

因此线性代数学的不好的话可能连结果都看不懂。最起码要了解最基础

的概念,线性代数在概率论中也有应用,比如协方差矩阵,在图论中和应用

有图的邻接矩阵等等,这两部分在下文中也会讲到,可以说数学这一部分的

学习联系十分紧密。

我认为在线性代数中需要掌握的知识有:向量的范数,矩阵的范数,QR

分解,奇异值分解,Cholesky分解等等(感觉后三个方面的内容可以在《数

值分析》一书中可以学得更透彻,我推荐大家看由黄明游、冯果忱编写的数

值分析的书籍。)

3、概率论与数理统计

这门课程可以说在机器学习的领域是至关重要的,机器学习的概念当中

都重点强调了“构建概率统计模型”,我来给大家捋一捋有关概率统计方面

的知识点(大部分理工科背景的朋友应该都学过这些,这里主要给偏文科背

景的朋友准备):

随机事件的概念、随机变量(包括离散型和连续性的)

条件概率的计算(可以引申出全概率公式与贝叶斯公式的推

导)

概率密度函数,分布函数(这里要重点了解几个分布:离散型

概率论部分 的有二项分布,泊松分布。连续型的有正态分布、指数分布、

均匀分布)

还要会一些多维密度函数的求解方法,了解独立性的性质

会计算数学期望,方差,相关系数

了解大数定律(如辛钦大数定律、伯努利大数定律、马尔可夫

大数定律)和中心极限定理

了解统计量的概念(不含未知参数的关于样本的函数)

抽样分布定理,三大抽样分布的特点和性质:卡方分布,t分

布,F分布

数理统计部分 参数估计的方法:矩估计,极大似然估计,一致最小方差无偏

估计(UMVUE),区间估计

假设检验的方法:t分布检验,F分布检验,正态分布检验

方差分析的方法,线性回归与非线性回归

掌握上面表格里面的内容就差不多了,在研究机器学习算法的问题时,一般


本文标签: 学习 数学 机器 分布 概率