人工智能大模型應(yīng)用案例實(shí)戰(zhàn)-3天
人工智能大模型應(yīng)用案例實(shí)戰(zhàn)-3天詳細(xì)內(nèi)容
人工智能大模型應(yīng)用案例實(shí)戰(zhàn)-3天
人工智能大模型應(yīng)用案例實(shí)戰(zhàn)
-15240011430課程簡(jiǎn)介
大模型也稱(chēng)為大語(yǔ)言模型(LLM)是指使用大量文本數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)模型,可以生成自然語(yǔ)言文本或理解語(yǔ)言文本的含義。這些模型通?;谏疃葘W(xué)習(xí)架構(gòu),如Transformer等,這有助于它們?cè)诟鞣NNLP任務(wù)上取得令人驚嘆的表現(xiàn)。目前的大語(yǔ)言模型(如GPT和BERT)采用與小模型類(lèi)似的Transformer架構(gòu)和預(yù)訓(xùn)練目標(biāo)(如 Language Modeling),與小模型的主要區(qū)別在于增加模型大小、多模態(tài)、訓(xùn)練數(shù)據(jù)和計(jì)算資源。
ChatGPT是一款由OpenAI開(kāi)發(fā)的大模型,它能夠模擬人類(lèi)的語(yǔ)言行為,與用戶進(jìn)行自然的交互。它的名稱(chēng)來(lái)源于它所使用的技術(shù)GPT-4架構(gòu),即生成式語(yǔ)言模型的第4代。
ChatGPT的核心技術(shù)是GPT-4架構(gòu)。它通過(guò)使用大量的訓(xùn)練數(shù)據(jù)來(lái)模擬人類(lèi)的語(yǔ)音行為,并通過(guò)語(yǔ)法和語(yǔ)義分析,生成人類(lèi)可以理解的文本。它可以根據(jù)上下文的語(yǔ)境,提供準(zhǔn)確和恰當(dāng)?shù)幕卮?,并模擬多種情緒和語(yǔ)氣。這樣,就可以讓用戶在與機(jī)器交互時(shí),感受到更加真實(shí)和自然的對(duì)話體驗(yàn)。
ChatGPT的應(yīng)用場(chǎng)景也很廣泛。它可以用于處理多種類(lèi)型的對(duì)話,包過(guò)對(duì)話機(jī)器人、問(wèn)答機(jī)器人和客服機(jī)器人等。它還可以用于各種自然語(yǔ)言處理任務(wù),比如文本摘要、情感分析和信息提取等。例如,在一個(gè)問(wèn)答系統(tǒng)中,ChatGPT可以提供準(zhǔn)確的答案,解決用戶的疑惑;在一個(gè)客服機(jī)器人中,他可以幫主用戶解決問(wèn)題,提供更好的服務(wù)體驗(yàn)。
此課程是尹立慶老師多年人工智能工作經(jīng)驗(yàn)的分享,重點(diǎn)介紹大模型以及揭開(kāi)大模型的神秘面紗,大模型未來(lái)發(fā)展趨勢(shì)和投資機(jī)會(huì)。
-15240011430培訓(xùn)目標(biāo)
大模型軟硬件架構(gòu)、分層;
介紹主流編程框架(和硬件結(jié)合);
各大主流大模型適用場(chǎng)景,優(yōu)劣勢(shì);
大模型調(diào)參;
openai接口介紹使用;
針對(duì)企業(yè)應(yīng)用和軟件開(kāi)發(fā)或工業(yè)場(chǎng)景的實(shí)戰(zhàn);
大模型調(diào)小模型示例,全程演示;
大模型幻覺(jué)介紹。
-15240011430培訓(xùn)對(duì)象
本課程適合于對(duì)大模型、ChatGPT的原理感興趣的人員;
本課程適合于架構(gòu)師、技術(shù)經(jīng)理、高級(jí)工程師;
適合于企業(yè)科技研發(fā)人員和人工智能科學(xué)家;
-15240011430培訓(xùn)方式
以課堂講解、演示、案例分析為主,內(nèi)容偏實(shí)用,結(jié)合講解與演示方式,循序漸進(jìn),輔以互動(dòng)研討、現(xiàn)場(chǎng)答疑、學(xué)以致用。
-15240011430課程安排
課程時(shí)間:3天
課程內(nèi)容:
時(shí)間
內(nèi)容
備注
第1天
大模型軟硬件架構(gòu)、分層(深入講解大模型軟硬件架構(gòu)、分層)(90分鐘)
大模型軟硬件架構(gòu)、分層
大模型的工作原理
大模型的軟件架構(gòu)
Transformer架構(gòu)
深度學(xué)習(xí)架構(gòu)
大模型的硬件架構(gòu)
NVIDIA GPU大語(yǔ)言模型架構(gòu)
NVIDIA的A100或H100 GPU
NVIDIA的Megatron-LM大模型框架
NVIDIA大模型框架TensorRT-LLM
Google大模型架構(gòu)
Google的TPU大規(guī)模硬件架構(gòu)
主流大模型訓(xùn)練架構(gòu)GPU+PyTorch+Megatron-LM+DeepSpeed
大模型的訓(xùn)練方法
數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、調(diào)優(yōu)
介紹主流編程框架(和硬件結(jié)合)(深入講解介紹主流編程框架(和硬件結(jié)合))(90分鐘)
介紹主流編程框架(和硬件結(jié)合)
主流大模型訓(xùn)練架構(gòu)GPU+PyTorch+Megatron-LM+DeepSpeed
大模型技術(shù)原理
大模型分布式訓(xùn)練框架
常用的分布式訓(xùn)練框架
Megatron-LM
DeepSpeed
Megatron-LM
DeepSpeed
3D并行化實(shí)現(xiàn)萬(wàn)億參數(shù)模型訓(xùn)練
DeepSpeed三種并行方法
數(shù)據(jù)并行訓(xùn)練
模型并行訓(xùn)練
流水線并行訓(xùn)練
ZeRO零冗余優(yōu)化器
如何選擇一款分布式訓(xùn)練框架
常見(jiàn)的分布式訓(xùn)練框架
TensorFlow
PyTorch
MindSpore
Oneflow
PaddlePaddle
Flax
Megatron-LM(張量并行)
DeepSpeed(Zero-DP)
Colossal-AI(高維模型并行)
Alpa(自動(dòng)并行)
訓(xùn)練超大規(guī)模語(yǔ)言模型主要技術(shù)路線
GPU + PyTorch + Megatron-LM + DeepSpeed
TPU + XLA + TensorFlow/JAX
參數(shù)高效微調(diào)(PEFT)技術(shù)
影響大模型性能的主要因素
衡量大模型水平
深度學(xué)習(xí)框架Pytorch
大模型編程選擇Pytorch的理由
Pytorch的大模型應(yīng)用案例
深度學(xué)習(xí)算法設(shè)計(jì)通用流程
PyTorch與Tensorflow對(duì)比
大模型分布式并行計(jì)算技術(shù)(大模型分布式并行計(jì)算技術(shù))(60分鐘)
大模型分布式并行計(jì)算技術(shù)
數(shù)據(jù)并行DP(Data Parallel)
分布式數(shù)據(jù)并行 DDP (Distribution Data Parallel)
張量并行
流水并行
G-pipe
PipeDream
virtual pipeline
梯度累加
激活檢查點(diǎn)
ZeRO
MPI、GLOO和NCCL等通信策略
大模型生態(tài)相關(guān)技術(shù)
英偉達(dá)GPU+CUDA架構(gòu)(英偉達(dá)GPU+CUDA架構(gòu))(60分鐘)
英偉達(dá)GPU+CUDA架構(gòu)
英偉達(dá)集合通信庫(kù)NCCL
通訊操作原語(yǔ)
廣播Broadcast
數(shù)據(jù)散播Scatter
規(guī)約運(yùn)算Reduce
AllReduce
數(shù)據(jù)收集Gather
AllGather
ReduceScatter
Nvlink
顯存優(yōu)化技術(shù)
重計(jì)算(Recomputation)
Activation checkpointing(Gradient checkpointing)
卸載(Offload)技術(shù)
ZeRO-Offload
ZeRO-Infinity
混合精度(BF16/FP16)
大模型分布式訓(xùn)練環(huán)境搭建(大模型分布式訓(xùn)練環(huán)境搭建)(60分鐘)
AI大模型分布式集群
AI大模型分布式集群通信
大模型分布式訓(xùn)練環(huán)境搭建
GPU服務(wù)器配置
CPU硬件配置清單
GPU硬件配置清單
AI處理器(加速卡)
安裝依賴(lài)包
配置環(huán)境
時(shí)間
內(nèi)容
備注
第2天
Pytorch大模型實(shí)踐案例(深入剖析深度學(xué)習(xí)框架Pytorch大模型實(shí)踐案例)(90分鐘)
Pytorch大模型實(shí)踐案例
Tensor以及相關(guān)的函數(shù)
Autograd機(jī)制以及相關(guān)函數(shù)
Torch.nn庫(kù)
Tensor操作函數(shù)
AutoGrad自動(dòng)求導(dǎo)
神經(jīng)網(wǎng)絡(luò)相關(guān)函數(shù)
導(dǎo)數(shù),方向?qū)?shù),偏導(dǎo)數(shù),梯度等
PyTorch搭建深度神經(jīng)網(wǎng)絡(luò)
使用PyTorch搭建手寫(xiě)數(shù)字識(shí)別
數(shù)據(jù)處理
模型搭建
模型訓(xùn)練
數(shù)據(jù)預(yù)測(cè)與識(shí)別
各大主流大模型適用場(chǎng)景,優(yōu)劣勢(shì)(深入講解各大主流大模型適用場(chǎng)景,優(yōu)劣勢(shì))(90分鐘)
各大主流大模型適用場(chǎng)景,優(yōu)劣勢(shì)
各大主流大模型適用場(chǎng)景,優(yōu)劣勢(shì)
ChatGPT-4大模型發(fā)展現(xiàn)狀
Sora大模型發(fā)展現(xiàn)狀
谷歌PaLM 2 AI大模型發(fā)展現(xiàn)狀
Claude大模型發(fā)展現(xiàn)狀
LLaMA大模型發(fā)展現(xiàn)狀
MidJournery大模型發(fā)展現(xiàn)狀
各大主流大模型適用場(chǎng)景,優(yōu)劣勢(shì)
百度文心一言
百度文心一格
阿里巴巴通義千問(wèn)
華為盤(pán)古
科大訊飛星火
AIGC大模型
ChatGPT
GPT4
文心一言
Google bard
DALL-E
本地模型
清華大學(xué)ChatGLM
Facebook LLaMa
Stable Diffusion
斯坦福Alpaca
OpenJourney
垂直領(lǐng)域產(chǎn)品
方問(wèn)智能中醫(yī)輔助系統(tǒng)
國(guó)內(nèi)大模型應(yīng)用建議(深度解讀國(guó)內(nèi)大模型應(yīng)用建議)(60分鐘)
百度文心一言應(yīng)用建議
阿里巴巴通義千問(wèn)應(yīng)用建議
華為盤(pán)古應(yīng)用建議
科大訊飛星火應(yīng)用建議
大模型調(diào)參(深入講解大模型調(diào)參)(90分鐘)
大模型調(diào)參
NVIDIA GPU加速和優(yōu)化大語(yǔ)言模型的性能
大模型微調(diào)
大模型微調(diào)的概念和意義
預(yù)訓(xùn)練模型的優(yōu)勢(shì)和應(yīng)用場(chǎng)景
大模型微調(diào)基本原理
大模型微調(diào)方法
數(shù)據(jù)加載、模型訓(xùn)練、調(diào)參等常見(jiàn)操作的優(yōu)化和加速方法
使用可視化工具進(jìn)行模型訓(xùn)練過(guò)程的分析和調(diào)試
大模型微調(diào)的基本流程和關(guān)鍵步驟
常用的深度學(xué)習(xí)框架和工具
TensorFlow、PyTorch等常見(jiàn)深度學(xué)習(xí)框架
Parameter-Efficient Fine-Tuning (PEFT)
預(yù)訓(xùn)練階段
目標(biāo)任務(wù)準(zhǔn)備
構(gòu)建微調(diào)任務(wù)
PEFT微調(diào)
常用的PEFT方法
Adapter Tuning
Prefix Tuning
Prompt Tuning
P-Tuning
LoRA
案例剖析:應(yīng)用大模型微調(diào)技術(shù)解決實(shí)際問(wèn)題
大模型微調(diào)技術(shù)與實(shí)踐(大模型微調(diào)技術(shù)與實(shí)踐)(30分鐘)
大模型微調(diào)技術(shù)與實(shí)踐
常見(jiàn)的大模型微調(diào)技術(shù)
知識(shí)蒸餾
遷移學(xué)習(xí)
領(lǐng)域適應(yīng)
案例大模型微調(diào)的實(shí)踐
文本分類(lèi)
圖像識(shí)別
自然語(yǔ)言處理
探討大模型微調(diào)過(guò)程中可能遇到的問(wèn)題和解決方案
選擇合適的預(yù)訓(xùn)練模型并進(jìn)行微調(diào)
如何評(píng)估微調(diào)效果和改進(jìn)方案
實(shí)際應(yīng)用案例分享與討論
時(shí)間
內(nèi)容
備注
第3天
openai接口介紹使用(深入講解openai接口介紹使用)(90分鐘)
openai接口介紹使用
獲取OpenAI API密鑰
選擇OpenAI API
安裝OpenAI SDK
調(diào)用OpenAI API
處理OpenAI API響應(yīng)
優(yōu)化API調(diào)用
管理API使用
反饋和改進(jìn)
實(shí)戰(zhàn)案例:Python調(diào)用OpenAI API實(shí)戰(zhàn)案例
針對(duì)企業(yè)應(yīng)用和軟件開(kāi)發(fā)或工業(yè)場(chǎng)景的實(shí)戰(zhàn)(深入講解針對(duì)企業(yè)應(yīng)用和軟件開(kāi)發(fā)或工業(yè)場(chǎng)景的實(shí)戰(zhàn))(90分鐘)
針對(duì)企業(yè)應(yīng)用和軟件開(kāi)發(fā)或工業(yè)場(chǎng)景的實(shí)戰(zhàn)
大模型的企業(yè)應(yīng)用場(chǎng)景
望聞問(wèn)切
視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)、語(yǔ)言、思考
文本生成
生成式對(duì)話、編寫(xiě)劇本、撰寫(xiě)論文
文本理解
情感分析、主題分類(lèi)、關(guān)系提取
語(yǔ)義理解、問(wèn)答系統(tǒng)
圖像理解與圖像生成
語(yǔ)音識(shí)別與語(yǔ)音合成
企業(yè)智能客服
視頻理解與視頻生成
大模型應(yīng)用的工業(yè)場(chǎng)景的實(shí)戰(zhàn)
智能制造和質(zhì)量控制
供應(yīng)鏈優(yōu)化
客戶服務(wù)和支持
智能能源管理
產(chǎn)品推薦和個(gè)性化營(yíng)銷(xiāo)
安全監(jiān)控和風(fēng)險(xiǎn)管理
生產(chǎn)優(yōu)化和預(yù)測(cè)維護(hù)
企業(yè)提高生產(chǎn)效率、降低成本
改善產(chǎn)品質(zhì)量和客戶體驗(yàn)
增強(qiáng)競(jìng)爭(zhēng)力并實(shí)現(xiàn)可持續(xù)發(fā)展
大模型的應(yīng)用中應(yīng)該重點(diǎn)關(guān)注什么
大模型調(diào)小模型示例,全程演示(深入講解大模型調(diào)小模型示例,全程演示)(90分鐘)
大模型調(diào)小模型示例,全程演示
模型壓縮(蒸餾、剪枝)
知識(shí)蒸餾
剪枝大模型
大模型蒸餾
提示語(yǔ)壓縮
聯(lián)合推理
模型串聯(lián)
數(shù)據(jù)采樣
遷移學(xué)習(xí)
權(quán)值共享
集成學(xué)習(xí)
將小模型作為插件
提示語(yǔ)壓縮
大模型幻覺(jué)介紹(深入講解大模型幻覺(jué)介紹)(90分鐘)
大模型幻覺(jué)介紹
什么是大模型幻覺(jué)
大模型幻覺(jué)分類(lèi)
事實(shí)性幻覺(jué)
忠實(shí)性幻覺(jué)
大模型產(chǎn)生幻覺(jué)的來(lái)源
數(shù)據(jù)源、訓(xùn)練過(guò)程和推理
預(yù)訓(xùn)練階段導(dǎo)致大模型幻覺(jué)
架構(gòu)缺陷
曝露偏差
能力錯(cuò)位
信念錯(cuò)位
檢測(cè)事實(shí)性幻覺(jué)的方法
檢索外部事實(shí)
不確定性估計(jì)
基于內(nèi)部狀態(tài)的方法
基于行為的方法
檢測(cè)忠實(shí)性幻覺(jué)的方法
基于事實(shí)的度量
分類(lèi)器度量
問(wèn)答度量
不確定度估計(jì)
提示度量
深度解讀glm2_6b大模型(深度解讀glm2_6b大模型)(90分鐘)
深度解讀glm2_6b大模型
glm2_6b大模型的原理
GPT(Generative Pre-trained Transformer)架構(gòu)
glm2_6b大模型數(shù)據(jù)集
glm2_6b大模型的部署
準(zhǔn)備環(huán)境
安裝依賴(lài)庫(kù)
下載模型權(quán)重
加載模型
部署API或服務(wù)
調(diào)優(yōu)和監(jiān)控
glm2_6b大模型的訓(xùn)練
glm2_6b大模型的應(yīng)用
自然語(yǔ)言處理
文本生成
機(jī)器翻譯
問(wèn)答系統(tǒng)
尹立慶老師的其它課程
AI大模型應(yīng)用企業(yè)內(nèi)部數(shù)據(jù)-15240011430課程簡(jiǎn)介大模型的應(yīng)用場(chǎng)景很廣泛,可以用于處理多種類(lèi)型的對(duì)話,包過(guò)對(duì)話機(jī)器人、問(wèn)答機(jī)器人和客服機(jī)器人等。它還可以用于各種自然語(yǔ)言處理任務(wù),比如文本摘要、情感分析和信息提取等。例如,在一個(gè)問(wèn)答系統(tǒng)中,大模型可以提供準(zhǔn)確的答案,解決用戶的疑惑;在一個(gè)客服機(jī)器人中,他可以幫助用戶解決問(wèn)題,提供更好的服務(wù)體驗(yàn)。大模型是
講師:尹立慶詳情
- [潘文富] 中小企業(yè)招聘廣告的內(nèi)容完
- [潘文富] 優(yōu)化考核方式,減少員工抵
- [潘文富] 廠家心目中的理想化經(jīng)銷(xiāo)商
- [潘文富] 經(jīng)銷(xiāo)商的產(chǎn)品驅(qū)動(dòng)與管理驅(qū)
- [潘文富] 消費(fèi)行為的背后
- [王曉楠] 輔警轉(zhuǎn)正方式,定向招錄成為
- [王曉楠] 西安老師招聘要求,西安各區(qū)
- [王曉楠] 西安中小學(xué)教師薪資福利待遇
- [王曉楠] 什么是備案制教師?備案制教
- [王曉楠] 2024年陜西省及西安市最
- 1社會(huì)保障基礎(chǔ)知識(shí)(ppt) 21158
- 2安全生產(chǎn)事故案例分析(ppt) 20229
- 3行政專(zhuān)員崗位職責(zé) 19044
- 4品管部崗位職責(zé)與任職要求 16221
- 5員工守則 15458
- 6軟件驗(yàn)收?qǐng)?bào)告 15393
- 7問(wèn)卷調(diào)查表(范例) 15113
- 8工資發(fā)放明細(xì)表 14554
- 9文件簽收單 14194