我可算懂了,本学期前半段的《随机过程》是进阶版《概率论》,后半段的《机器学习》是进阶版《数理统计》。谢谢多伦多大学研一秋,让我体验进阶版南京大学大二上。
版本 2022.12.05,Ver0.0
参考文献:Mehta P et. al., Phys Rep. 2019 May 30;810:1-124.
有监督的 (Supervised)
给定数据集,以及每个数据点的标签。如果拿到一个新的数据点,它的标签将是什么?
如果标签是连续取值——线性回归(Linear Regression)
最小二乘回归
统计解释: maximum likelihood estimation of a vector \(x\), given linear measurements corrupted by Gaussian measurement errors.
如果标签是离散类别——逻辑回归(Logistic Regression)
- 缺点:逻辑回归是一种线性归类,难以精确分类。对策:使用多层神经网络,实现非线性归类。
无监督的(Unsupervised)
给定一坨数据,它们有怎样的结构?
降维
- 主元分析 (PCA)
- SVD 分解
- t-SNE
- Diffusion Map
聚类
- K-means
- Gaussian Mixture Model
文档信息
- 本文作者:L Shi
- 本文链接:https://SHI200005.github.io/2022/12/05/Machine-Learning/
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)