一些概念

感知器:比较预测值和真实值之间的偏差,逐渐调整参数,使得模型拟合。每次调整的步长称为学习率。
支持向量机:二分类问题画一条直线使得两个分类之间的间隔最大。因为点距离直线越远模型的可信度越高。相机中的人脸识别是二分类问题。
卷积操作常用于图像特征的提取。将一个小矩阵和图像特征矩阵进行卷积运算可以得到一个新的矩阵,新的矩阵可以看做是一个新的图像,比原图像更清楚表达了某些性质,因此可以看做是图像的一个特征(从这一点看卷积操作有点类似于PCA,主成分分析)

什么是机器学习

利用计算机从历史数据中找出规律,并将这些规律用到对未来的不确定场景的决策(例如预测下个季度公司的业绩销量)。

典型应用

  • 关联规则。啤酒加尿布,这种就叫做购物篮分析(看看哪些商品是被同时购买的),用到的算法是关联规则。
  • 聚类。用户细分,精准营销。例如中国移动分为全球通(商务人士)、动感地带(学生,信息流量较多)、神州行(普通务工人员,电话较多)。
  • 朴素贝叶斯和决策树。朴素贝叶斯例如垃圾邮件,决策树例如信用卡欺诈,骗贷.人脸识别用了AdaBoost算法(决策树)。
  • CTR和协同过滤。例如百度搜索的百度推广的顺序是进行了预估,最可能被点击的放在第一条。商品推荐系统使用了协同过滤。
  • 自然语言处理。情感分析和实体识别。
  • 深度学习。例如图像识别。