admin管理员组文章数量:1794759
【机器学习01】概述
1 机器学习概述 1.1 什么是机器学习
机器学习是一门能够让编程计算机从数据中学习的计算机科学
一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现,也就是用以 衡量的P,随着E的增加而增加,那么这样计算机程序就被称为机器学习系统
自我完善、自我增进、自我适应
1.2 为什么需要机器学习- 自动化的升级和维护
- 解决那些算法过于复杂甚至根本就没有已知算法的问题
- 在机器学习的过程中协助人类获得对事物的洞见
建模问题
所谓机器学习,在形式上可以这样理解:在数据对象中通过统计或推理的方法,寻找一个接受特定输入X,并给出预期输出Y的功能函数f,即Y=f(X)
评估问题
针对已知的输入,函数给出的输出(预测值)与实际输出(目标值)之间存在一定的误差,因此需要构建一个评估体系,根据误差的大小判定函数的优劣
优化问题
学习的核心在于改善性能,通过数据对算法的反复锤炼,不断提升函数预测的准确性,直至获得能够满足实际需求的最优解,这个过程就是机器学习
有监督学习、无监督学习、半监督学习、强化学习
批量学习和增量学习
基于实例的学习和基于模型的学习
基于实例的学习:根据以往的经验,寻找与待预测输入最接近的样本,以其输出作为预测结果
25 | 硕士 | 2 | 女 | 10000 |
20 | 本科 | 3 | 8000 | |
… | … | … | … | … |
20 | 本科 | 3 | 男 | ? |
基于模型的学习:根据以往的经验,建立用于联系输出和输入的某种数学模型,将待预测输入代入该模型,预测其结果
数据处理
机器学习
业务运维
股价预测、推荐引擎、自然语言处理、语音识别、图像识别、人脸识别
1.9 机器学习的基本问题1)回归问题:根据已知的输入和输出寻找某种性能最佳的模型,将未知输出的输入代入模型,得到连续的输出
2)分类问题:根据已知的输入和输出寻找某种性能最佳的模型,将未知输出的输入代入模型,得到离散的输出
3)聚类问题:根据已知输入的相似程度。将其划分为不同的群落
4)降维问题:在性能损失尽可能小的前提下,降低数据的复杂度
1.10 机器学习之Sklearn库Scikit learn简称为Sklearn,是机器学习领域当中最知名的python模块之一
Sklearn库包含了许多机器学习的方式:
- Classification 分类
- Regression 回归
- Clustering 聚类
- Dimensionality reduction 数据降维
- Model Selection 模型选择
- Preprocessing 数据预处理
本文标签: 机器
版权声明:本文标题:【机器学习01】概述 内容由林淑君副主任自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.xiehuijuan.com/baike/1686512500a75974.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论