机器学习概论
什么是机器学习
机器学习是从人工智能中产生的一个重要分支,是实现智能化的分支。
百度百科是从机器学习做什么来定义的。
而维基百科从怎么做来定义。
机器学习的一般过程
而机器学习的重点就是图中的f(x)。
f(x)由三部分组成
- 模型
- 策略
- 算法
模型可以是对于问题的一个假设,像让机器去学习这个东西是不是狗,如二分问题,线性二分问题等
策略是模型想要学习的目标,通俗来说,可以理解为评价标准。评价学生成绩好、道德好等。策略制定的方向将直接影响模型学习的效果。
算法将求解参数等。
机器学习方法
左图通过分类年轻人、老年人,头发是不是黑,走路是不是快来分辨他是年轻人还是老年人
右图是回归,给定10年的房价,看房价与房子面积的关系,最终实现给一个面积,得房价
而无监督学习则是没有标注的训练数据集,需要根据样本间的统计规律对样本集进行分析,常见任务如聚类等
半监督学习:结合(少量的)标注训练数据和(大量的)未标注数据来进行数据的分类学习。
两个基本假设:
1. 聚类假设:聚类样本中有相同标记,距离就更近
2. 流行假设:在流行区域内,样本示例有相似性
增强学习:外部环境对输出只给出评价信息而非正确答案,学习机通过强化受奖励的动作来改善自身的性能。
简单地说:只对算法进行评价,不告诉计算机怎么学。
多任务学习:把多个相关的任务放在一起同时学习。
具有泛化效果。