机器学习简介
约 537 个字 预计阅读时间 2 分钟
Abstract
我个人记录的很简单,主要是有些数学推导我确实看不懂,我也懒得用latex敲一遍
参考资料
- CS229是吴恩达老师授课的一门机器学习课,网上有笔记,可以直接对着别人笔记学,看不懂的再看视频
- 小角龙前辈的博客,上面的数学证明比较全,文字部分也比较易懂
- 计院的专业课机器学习,可以去智云上看
机器学习简介
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
分类
监督学习
如果样本带有预先设定的标签,就说我们正在进行监督学习,这种监督来自于标签,它们控制着比较步骤,并告诉算法是否预测了正确的标签。Learning a mapping from input x to output y. 监督学习有两种类型:
-
分类(classification):离散,y is a cantegorical varible比如人脸识别
-
回归(regression):连续,y is real-valued 比如预测房价
无监督学习
当输入的数据没有标签时,从这些数据中学习的算法均称为无监督学习,在没有帮助的情况下,系统必须自己解决所有问题。比如大模型都可以算无监督学习。 无监督学习有三种类型:
-
聚类算法(clustering algorithm)
-
降噪算法(noise reducing algorithm)
-
降维算法(dimension reduction algorithm)
强化学习
总体思路是这样:智能体(agent)先采取一个行动,环境接纳这个行动并且通常会做出相应的改变来响应这个行动;然后环境会向这个智能体发送一个奖励信号(reward),告诉它这个操作有多好或者多坏。比如AlphaGO,甚至可以自己和自己对练。