大话机器学习
一些概念
感知器:比较预测值和真实值之间的偏差,逐渐调整参数,使得模型拟合。每次调整的步长称为学习率。
支持向量机:二分类问题画一条直线使得两个分类之间的间隔最大。因为点距离直线越远模型的可信度越高。相机中的人脸识别是二分类问题。
卷积操作常用于图像特征的提取。将一个小矩阵和图像特征矩阵进行卷积运算可以得到一个新的矩阵,新的矩阵可以看做是一个新的图像,比原图像更清楚表达了某些性质,因此可以看做是图像的一个特征(从这一点看卷积操作有点类似于PCA,主成分分析)
什么是机器学习
利用计算机从历史数据中找出规律,并将这些规律用到对未来的不确定场景的决策(例如预测下个季度公司的业绩销量)。
典型应用
- 关联规则。啤酒加尿布,这种就叫做购物篮分析(看看哪些商品是被同时购买的),用到的算法是关联规则。
- 聚类。用户细分,精准营销。例如中国移动分为全球通(商务人士)、动感地带(学生,信息流量较多)、神州行(普通务工人员,电话较多)。
- 朴素贝叶斯和决策树。朴素贝叶斯例如垃圾邮件,决策树例如信用卡欺诈,骗贷.人脸识别用了AdaBoost算法(决策树)。
- CTR和协同过滤。例如百度搜索的百度推广的顺序是进行了预估,最可能被点击的放在第一条。商品推荐系统使用了协同过滤。
- 自然语言处理。情感分析和实体识别。
- 深度学习。例如图像识别。
LLM
AGI 是 AI 的终极形态,几乎已经成为业界共识。构建智能体 Agent 则是 AI 工程应用当下的“终极形态”。大模型出现之后,AI Agent 衍生出了一种全新的架构模式,将最重要的规划、决策部分或者全部交给 LLM 完成。
智能体式具有自主性和智能的程序或者系统,能感知、规划、决策并执行相关任务。
名词解释
LoRA:插件式微调,用于对 LLM 进行个性化的特殊任务的定制。例如 AI 绘画领域的 SD 微调。通过将模型的权重矩阵分解成低秩的相似矩阵,降低了参数空间的复杂性,从而减少微调的计算成本和模型存储要求。
向量数据库:存储和管理大量的矢量数据(非结构化),例如:图像、视频、音频、文本等,同时提供高效的检索功能。
ReAct Agent:是一种结合推理(Reasoning)和行动(Action)的智能体(Agent)框架,旨在让大语言模型(LLM)更高效地完成复杂任务。它通过动态推理和外部工具调用来增强模型的决策能力,适用于问答、工具调用、多步任务规划等场景。
结合大模型的新一代应用的交互方式
- Embedding:AI 是执行工具,人类是决策者和指挥者。例如创作小说、音乐。
- Copilot:AI 提供建议并协助任务,二者互补,AI 更像知识丰富的伙伴而非工具。例如 Github Copilot。
- Agent:人类设定目标并提供资源,AI 独立完成大部分工作,最后人类监督和评估结果。例如:AutoGPT,Manus。
在企业中的应用场景
- 智能客服(LLM + 企业知识库)
- 基于 Agent/LLM 的数据分析(非结构化数据,难以用传统方式编程建模)
Prompt 优化技巧
- 明确角色:例如“你是一位 java 程序员”
- 提供细节要求:例如“写一篇 200 字的总结,突出专业性”
- 任务拆解:例如“先需求分析,再技术选型,最后编码实现,并生成项目总结”
- 提供示例:例如“模仿李白的《静夜思》,创作一首表达思乡之情的五言诗歌”
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 雨碎江南!