课程三大亮点
1.全栈进阶:从机器学习到LLM开发,构建完整AI知识体系。
核心亮点: 系统化分层教学。
基础层: Python+Pandas夯实数据处理能力;
核心层: 覆盖机器学习全模型(线性回归、SVM、决策树、集成学习、贝叶斯等)+ 深度学习(CNN、RNN、Transformer);
前沿层: 深入NLP与大模型(BERT、T5、Llama),含轻量微调(LoRA)、指令对齐(RLHF/DPO)等工业级技术。
项目贯穿: 电商推荐系统(传统机器学习)→金融智能客服(大模型应用),实战贯穿技术演进路径。
.jpg)
2. 工业级实战:聚焦企业刚需场景,培养解决方案能力。
.jpg)
核心亮点: 真实业务场景驱动。
电商推荐系统: 特征工程、精排模型选型、效果优化方法论;
金融智能客服: 意图识别、文档知识抽取、FAQ生成等NLP任务拆解与模型开发。
企业级技术栈:
工具链: Scikit-learn、PyTorch、HuggingFace Transformers、Llama;
工程实践: GPU并行计算、模型微调、效果分析、调优策略。
3. 拥抱AI浪潮:大模型技术深度整合,抢占职业新风口。
模型全链路教学:
理论: GPT发展史、注意力优化、位置编码、指令对齐技术;
实践: 基于Llama开发对话系统,实现轻量微调(LoRA)等工业热门技术。
预训练模型深度应用: 掌握“预训练+微调”范式,完成情感分析、命名实体识别等NLP任务; 对比FastText/BERT/T5等模型效果,培养技术选型能力。
.jpg)
课程大纲
课程名称 | 课时 | 讲解内容 | 教学目标 |
Python编程 | 72 | 技术:Python入门基础、数据类型、运算符、数 据类型转换、流程控制、函数、模块与包。 | 掌握:使用Python语言进行程序开发的能力。 |
Pandas应用(Sec1~Sec5) | 40 | 技术:Series、数据导入/导出、DataFrame、常 用函数、数据清洗的方法、常用转换函数、常用 时间函数、索引与高维索引、分组与聚合 | 掌握:使用Pandas库完成数据清洗、转换、统计计 算的能力。 |
课程名称 | 课时 | 讲解内容 | 教学目标 |
机器学习基础 | 16 | 理论:机器学习的概念和应用举例,机器学习的
流程和框架,机器学习的基本要素(模型,损失函
数,优化算法),机器学习模型的分类;必要的线
性代数和微分数学基础。 技术:机器学习的数据处理,包括数据预处理、 异常值的发现和处理、特征归一化、相关性分析 等。 |
理解:机器学习基本概念和必要的数学基础。 掌握:使用Pandas进行机器学习数据处理和特征计 算的能力。 |
线性回归模型 | 20 | 理论:回归模型的概念,线性回归模型的预测函
数、损失函数、评价指标;线性回归模型的优化
(解析法和梯度下降法);欠拟合与过拟合问题;
特征选择和特征优化的方法;L1和L2正则化。 技术:scikit-learn机器学习库的使用,线性回 归模型实操。 |
理解:线性回归模型的概念和训练算法,特征选择
和特征优化的方法,正则化的概念和应用场景。 掌握:使用scikit-learn解决线性回归问题,通过特 征选择和正则化的方式解决过拟合问题。 |
逻辑回归和SVM模型 (判别式分类模型) | 20 | 理论:分类问题应用举例,分类问题的指标,概
率模型和非概率模型;逻辑回归模型的定义、损
失函数和优化算法;线性分类器和线性可分问题
、最大间隔分类器;线性SVM的定义、损失函数和
优化算法;核技巧 (非线性SVM)。 技术:逻辑回归和SVM模型的训练和预测实操。 |
理解:分类问题的定义和评价指标,逻辑回归模型
的定义、损失函数和优化算法,SVM模型的定义、损
失函数和优化算法。 掌握:使用scikit-learn完成逻辑回归模型和SVM模 型的训练、预测。 |
决策树和集成学习模型 (可同时应用于回归和分类) | 20 | 理论:决策树的定义,解决分类和回归问题的过
程,对特征空间的划分;CART决策树的特征选择
、生长算法和裁剪算法;超参数调优方法和交叉
检验;集成学习的概念;随机森林模型及其训练
算法;提升树 (包括XGBoost、LightGBM)模型及
其训练算法。 技术:CART树和XGBoost、LightGBM模型训练及 预测实操。 |
理解:决策树模型的概念和训练算法,集成学习的
概念,随机森林模型的概念和训练算法,提升树模
型(XGBoost、LightGBM)模型的概念和训练算法,超
参数调优和交叉检验。 掌握: 使用scikit-learn实现决策树和提升树模型的训练,预测 |
朴素贝叶斯模型 (产生式分类模型) | 8 | 理论: 必要的概率和数理统计基础;判别式模型
和产生式模型;朴素贝叶斯模型;极大似然估计
。 技术:朴素贝叶斯模型训练及预测实操。 |
理解:判别式模型和产生式模型的概念,朴素贝叶
斯模型,极大似然估计。 掌握: 使用scikit-learn实现朴素贝叶斯模型的训 练、预测。 |
电商推荐模型实战(项目) | 20 | 业务:电商推荐的业务背景,推荐系统的架构和
主要模块,推荐系统的推荐指标 理论: 推荐精排模型的选型,推荐模型的特征工 程,模型效果分析和提升的方法论 技术: 使用Pandas进行数据处理和可视化分析, 使用scikit-learn等机器学习包进行模型训练和 预测,模型效果分析和效果提升实践。 |
掌握:业务机器学习模型开发的流程和方法,模型 训练、效果分析和优化的实践经验。 |
课程名称 | 课时 | 讲解内容 | 教学目标 |
深度学习基础 | 36 | 理论:深度学习的概念,神经网络拟合复杂函数
的能力,神经网络特征提取的能力,深度学习解
决分类问题和回归问题的方法,深度学习的发展
史。 技术: 深度学习环境的安装,算力租用平台的注 册、使用,GPU并行计算,PyTorch Tensor运算, PyTorch自动求导,PyTorch数据、模型、损失函 数、优化器等模块,基于PyTorch重新实现线性回 归模型的训练、预测。 |
理解:深度学习的概念,神经网络的学习能力,深
度学习解决分类和回归问题的方法,深度学习的发
展史和标志性事件 掌握: 深度学习环境的安装,基于PyTorch开发神经 网络模型。 |
卷积神经网络 (CNN) | 24 | 理论:卷积层的定义和作用(局部特征提取
器),池化层的定义和作用,填充和步幅,感受
野和分辨率,适合CNN解决的问题举例和总结;神
经网络训练相关策略:早停策略、学习率控制策
略;与神经网络效果相关的结构:Dropout、ReLU 、Batch Norm & Layer Norm、Residual
Connection;现代卷积网络:AlexNet, VGG,
ResNet等。 技术: 利用PyTorch实现CNN模型的训练和预测, 在Fashion-MNIST数据集上比较各种CNN相关网络 结构的效果。 |
理解:CNN的网络结构和作用,CNN适合解决的问
题,神经网络训练相关的策略和结构,典型的现代
卷积网络。 掌握: 利用PyTorch完成CNN模型的训练和预测,分 析和优化模型效果的方法。 |
Transformer和循环神经网络 (RNN) | 42 | 理论:上下文建模的概念;注意力机制;位置编
码;Layer Norm和残差连接;Transformer
encoder block;Transformer decoder block;
随机梯度下降的改进算法;RNN的基本结构;RNN
的改进型 (GRU & LSTM);双向RNN;BPTT算法;
RNN和Transformer的对比。 技术: 利用PyTorch和HuggingFace Transformers包实现Transformer模型的训练和 预测,完成命名实体识别任务。 |
理解:Transformer和RNN的网络结构和作用,适合
解决的问题,随机梯度下降的改进算法,RNN计算梯
度的BPTT算法。 掌握: HuggingFace Transformers包的使用,基于 Transformer模型完成命名实体识别任务。 |
自然语言处理(NLP)专题 | 40 | 理论:NLP的主要应用,NLP的主要算法问题,基
于词权重向量的文本表示,分词原理和实操,TF-IDF,基于词权重向量的文本相似度,词嵌入的概
念,上下文无关的词嵌入模型 (Skip-Gram,
CBOW, FastText等),Bert预训练模型
(Encoder-Only架构),T5预训练模型(Encoder-Decoder架构) 技术: 掌握预训练模型+微调的模型开发范式,分 别基于FastText和Bert实现情感分析任务,并比 较效果和性能。 |
理解:NLP的主要应用和算法问题,基于词权重向量
和词嵌入的文本表示,预训练模型及其下游任务 掌握: 通过对预训练模型进行微调,完成各种下游 NLP任务的方法。 |
大模型(LLM)专题 | 44 | 理论:机LLM的概念;GPT系列的发展历史;主流的
开源(Llama等)和闭源大模型;主要的LLM应用;
高效的注意力算法;旋转位置编码;指令对齐的
概念;主要的指令对齐算法 (SFT、RLHF、DPO);
轻量微调算法 (LoRa等)。 技术:使用Llama等开源大模型开发NLP应用的方 法 (以对话系统为例)。 |
理解:理解:LLM的概念和主要应用,LLM结构上的主要改
变,指令对齐的概念和主流算法,轻量微调的主要
算法。 掌握: 利用Llama等开源发模型开发NLP应用的方法 |
金融领域智能客服系统(项目) | 24 | 业务:金融领域智能客服的业务背景,系统架构
及核心模块,业务需求分析,NLP任务拆解 (意图
识别和填槽,对话控制,文档知识抽取,FAQ,文
本生成等) 理论: NLP算法选型的方法论,各个NLP任务的主 流模型和效果比较 技术:使用PyTorch、HuggingFace Transformers以及Llama、Bert等开源预模型开发 业务模型。 |
掌握:利用Llama等开源模型开发一个完整NLP应用 系统的方法,业务场景下模型选型和调优的方法。 |