計算機視覺的深度學習實踐
計算機視覺的深度學習實踐詳細內(nèi)容
計算機視覺的深度學習實踐
計算機視覺的深度學習實踐
【課程時長】
3天(6小時/天)
【課程簡介】
在所有人工智能的應用方向上,計算機視覺/機器視覺圖像處理的落地應用最為成熟,近兩年的技術發(fā)展是最為迅猛。
以互聯(lián)網(wǎng)巨頭為代表的企業(yè)正在開展如:基于識別的智能機器人,無人駕駛,人臉識別、圖像搜索,圖像處理,游戲界面等;專門從事視覺、圖像處理的新興公司正在發(fā)力于人臉識別,檢測,跟蹤,安防等領域。只有對計算機視覺這個領域有了一個初步的全面了解才能在這些領域進行研究,一步步深入下去。
【課程目標】
計算機視覺領域的重點研究問題。由淺入深得 講解數(shù)字圖像的存儲、預處理、特征提取,以及在深度學習興起之前計算機視覺領域所取得的成就。
專門介紹深度學習的基礎理論知識,包括神經(jīng) 網(wǎng)絡的基本原理,以及深度學習對于傳統(tǒng)神經(jīng) 網(wǎng)絡的關鍵改進。
重點介紹深度學習模型在計算機視覺領域的應用。具體涉及在計算機視覺領域如何應用卷積 神經(jīng)網(wǎng)絡(CNN)、區(qū)域卷積網(wǎng)絡(R-CNN) 全卷積網(wǎng)絡(FCN)、循環(huán)神經(jīng)網(wǎng)絡(RNN)、 長短時記憶單元(LSTM)、生成對抗網(wǎng)絡 (GAN)等解決圖像應用的難點 課程將使用Python語言及Tensorflow、Keras 深度學習框架等進行案例實踐教學。【講師介紹】
葉梓,博士、高級工程師。2005年上海交通大學計算機專業(yè)博士畢業(yè),主研方向為數(shù)據(jù)挖掘、機器學習、人工智能等?,F(xiàn)為某大型上市軟件企業(yè)的人工智能團隊技術負責人。曾主持多項國家戰(zhàn)略級人工智能項目,主持設計并搭建多個市級大數(shù)據(jù)平臺,在大數(shù)據(jù)、人工智能應用等方面有著豐富的工程實踐經(jīng)驗。先后在SCI或EI期刊上發(fā)表論文4篇,在中文核心期刊上發(fā)表論文近20篇,并被百度學術收錄。2011年獲中國行業(yè)協(xié)會科技創(chuàng)新一等獎。
第一講 課程概述
1、計算機視覺的研究意義
2、計算機視覺的難點
3、當前研究的主要熱點問題(分類、目標檢測、實例分割、圖說等)
4、本課程的主要內(nèi)容介紹
5、相關開源庫介紹(OpenCV、Tensorflow、Keras、pyTorch等)
6、應用案例:搭建tensorflow+opencv的環(huán)境
第二講 圖像預處理
1、圖像平滑與去噪(高斯濾波、中值濾波等)
2、基于直方圖的對比度增強:CLAHE
3、邊緣檢測算子(Sobel、拉普拉斯等)
4、形態(tài)學處理(腐蝕、膨脹、開閉運算等)
5、高斯金字塔與拉普拉斯金字塔
6、頻域分析及變換(卷積計算、傅里葉變換、小波變換)
7、應用案例:平滑、邊緣檢測、CLAHE、FFT等
第三講 圖像特征提取
1、顏色特征(量化直方圖、聚類直方圖)
2、幾何特征(Edge、Corner、Blob等)
3、Harris角點與FAST角點
4、基于關鍵點的特征描述子(SIFT、SURF、ORB)
5、其他特征提?。↙BP、Gabor)
6、應用案例:SIFT、圖像拼接等
第四講 未有深度學習之前
1、基于灰度的圖像分割(閾值分割、區(qū)域生長、分水嶺等)
2、基于圖論:graph-cut與grab-cut
3、用于人臉檢測的Haar-like特征與級聯(lián)分類器
4、用于行人檢測的HOG+SVM
5、用于行人檢測的多尺度形變部件模型(DPM)
6、應用案例:人臉識別、行人識別
第五講 神經(jīng)網(wǎng)絡與誤差反向傳播算法
1、人工神經(jīng)元及感知機模型
2、目標函數(shù)(MSE)
3、激勵函數(shù)(sigmoid、tanh)
4、誤差反向傳播算法的推導
5、應用案例:可以手算的BP神經(jīng)網(wǎng)絡
6、深度學習與神經(jīng)網(wǎng)絡的區(qū)別與聯(lián)系
第六講 深度學習基礎
1、深度學習中的目標函數(shù)與激勵函數(shù)
2、深度學習中的求解方法(Adagrad、RMSprop、Adam等)
3、深度學習中的技巧(dropout、BN、weights decay等)
4、應用案例:利用tensorflow實現(xiàn)的手寫數(shù)字識別
5、卷積神經(jīng)網(wǎng)絡介紹
6、卷積層的誤差反向傳播
7、池化層的誤差反向傳播
第七講 圖像分類
1、競賽中的分類問題
2、CNN的發(fā)展概述
3、開山之作:AlexNet4、5層變?yōu)?組:VGG
5、組合所有可能的模型:GoogLeNet6、殘差網(wǎng)絡:ResNet7、深與寬之外的改進方向:ResNext6、應用案例:VGG、ResNet第八講 圖像檢索
1、檢索特征(基于顏色,紋理,形狀,局部特征)
2、特征相似度度量(EMD)
3、建立基于深度學習的檢索索引
4、知識點:遷移學習的一種實現(xiàn)(fine-tune)
5、索引加速:KD-tree
6、大數(shù)據(jù)條件下的索引加速:Locality Sensitive Hash
7、應用案例:CBIR的應用
第九講 目標檢測(上)
1、目標檢測任務概述
2、區(qū)域卷積神經(jīng)網(wǎng)絡:R-CNN
3、共享卷積層與多尺度:SPP-Net
4、多任務的目標函數(shù):Fast R-CNN
5、SS改成RPN:Faster R-CNN
6、其他數(shù)據(jù)集介紹:行人檢測、人臉檢測
7、應用案例:Faster R-CNN
第十講 目標檢測(下)
1、之前方法的總結(jié)
2、ROI-wise子網(wǎng)繼續(xù)共享:R-FCN
3、回歸解決一切:YOLO v1
4、八大改進:YOLO v2
5、構(gòu)建語義樹:YOLO 9000
6、多尺度預測:YOLO v3
7、應用案例:Darknet實現(xiàn)的YOLO
第十一講 通用場景下的圖像分割
1、語義分割
2、全卷積網(wǎng)絡語義分割:FCN
3、知識點:反卷積、轉(zhuǎn)置卷積與空洞(膨脹)卷積
4、DeepLab v1(含CRF)
5、DeepLab v2(多尺度)
6、DeepLab v3與v3+(多尺度級聯(lián))
7、PASCAL VOC、MS COCO、Cityscapes等數(shù)據(jù)集介紹
8、應用案例:DeepLab、denseCRF第十二講 醫(yī)療影像分割
1、醫(yī)學影像分析任務概述與數(shù)據(jù)集
2、U-Net
3、3D U-NET與V-Net
4、FC-DenseNet5、病理切片分析任務概述與數(shù)據(jù)集6、病理切片分析的實現(xiàn)
7、應用案例:利用U-Net實現(xiàn)的器官分割
第十三講 圖像描述(圖說)
1、深度學習的語言模型(RNN)
2、知識點介紹;LSTM與GRU
3、圖說模型原理與結(jié)構(gòu)
4、模型增強:注意力機制
5、圖說效果的評判標準
6、數(shù)據(jù)集介紹(MS COCO, Flickr等)
7、應用案例:RNN簡單示例,圖像描述:show and Tell
第十四講 圖像生成
1、變分自編碼器(VAE)
2、生成對抗網(wǎng)絡(GAN)
3、知識點:KL散度與JS散度
4、改進的GAN:DCGAN
5、從根本上解決訓練的困難:Wasserstein GAN
6、超分辨率問題:SRGAN
7、應用案例:GAN與DCGAN等
葉梓老師的其它課程
DeepSeek 輔助日常工作培訓提綱 03.03
DeepSeek輔助日常工作培訓提綱一、引言介紹大模型領域的競爭態(tài)勢強調(diào)DeepSeek的獨特優(yōu)勢二、DeepSeek概述DeepSeek的發(fā)展背景與定位DeepSeek各版本的特點與區(qū)別三、DeepSeek部署本地單機部署DeepSeek蒸餾版的硬件要求本地單機部署DeepSeek(量化)滿血版的配置與性能本地單機多卡部署DeepSeek(量化)滿血版的策
講師:葉梓詳情
知識圖譜的Python實現(xiàn) 03.03
知識圖譜的Python實現(xiàn)【課程簡介】本課程包含知識圖譜的基本概念及常用算法,并實現(xiàn)了一個基于知識圖譜的對話機器人。通過1天的系統(tǒng)學習、案例講解和動手實踐,讓學員能初步了解知識圖譜的的相關知識與技術。【課程對象】理工科本科以上,或至少了解一種編程語言。知識圖譜基礎知識圖譜存儲知識圖譜基礎概念知識推理本體推理方法本體推理工具語義搜索RDF與RDFSOWL與OW
講師:葉梓詳情
智能醫(yī)療技術與ChatGPT臨床應用三日深度培訓第一天:人工智能基礎與Python編程入門上午:人工智能在醫(yī)療領域的應用概述Python編程基礎環(huán)境搭建、數(shù)據(jù)類型、流程控制Python環(huán)境搭建Python數(shù)據(jù)類型與流程控制Python函數(shù)的應用Python面向?qū)ο缶幊?文件讀寫和目錄操作異常處理機器學習概述數(shù)據(jù)探索性分析:智能化數(shù)據(jù)分析特征工程:數(shù)據(jù)準備、數(shù)
講師:葉梓詳情
人工智能“最強模型”transformer詳解【課程簡介】Transformer是迄今為止人工智能領域的最新和最強大的模型類別之一。它幾乎正在憑借一己之力來推動深度學習的又一波重大進步。Transformer模型充分運用了稱為注意力和自注意力機制,以檢測系列(或圖像)中元素相互影響和相互依賴的微妙關系。本課程通過2天時間的詳細介紹,可使學習者初步了解Tran
講師:葉梓詳情
人工智能+自然語言處理3天 03.03
||1.人工智能概述||第一節(jié):人工智能與機器學習基礎|2.機器學習概述|||3.機器學習算法應用分析|||1.一元線性回歸|||2.代價函數(shù)|||3.梯度下降法||第二節(jié):回歸算法|4.sklearn一元線性回歸應用|||5.多元線性回歸|||6.sklearn多元線性回歸應用|||案例:葡萄酒質(zhì)量和時間的關系|||1.KNN分類算法介紹|||2.KNN分
講師:葉梓詳情
人工智能算法詳解 03.03
人工智能技術詳解【課程內(nèi)容】本課程包含大數(shù)據(jù)、機器學習、深度學習、知識圖譜、強化學習與深度強化學習的相關知識?!菊n程時長】7天(7小時/天)【課程對象】理工科本科及以上,且至少了解一門編程語言。【課程大綱】(培訓內(nèi)容可根據(jù)客戶需求調(diào)整)時間內(nèi)容案例實踐與練習Day1上午準備工作準備工作1.概念與術語2.Python(Anaconda)的安裝3.Pycharm
講師:葉梓詳情
人工智能與深度學習_3天 03.03
人工智能與深度學習第一天:人工智能概念與經(jīng)典算法人工智能概念綜述(第一天——1)從一些術語辨析人工智能人工智能之連接主義的興衰史這次AI的熱潮是怎么來的?圖像處理領域的最新熱點(第一天——2)分類、目標檢測與實例分割風格遷移自動駕駛?cè)梭w姿態(tài)識別超分辨率圖像生成語言處理領域的最新熱點(第一天——3)Attention機制自動構(gòu)建知識圖譜看圖說話預訓練機制三大經(jīng)
講師:葉梓詳情
人工智能之最新自然語言處理技術與實戰(zhàn)課程介紹:自然語言處理(簡稱NLP)是計算機科學和人工智能研究的一個重要方向,研究計算機和理解和運用人類語言進行交互的問題,它是集語言學、機器學習、統(tǒng)計學、大數(shù)據(jù)于一體的綜合學科。本課程主要介紹了NLP中的常用知識點:分詞、詞法分析、句法分析、向量化方法、經(jīng)典的NLP機器學習算法,還重點介紹了NLP中最近兩年來基于大規(guī)模語
講師:葉梓詳情
第一天上午:統(tǒng)計分析原理從最簡單的案例開始統(tǒng)計基礎描述性統(tǒng)計用SPSS實現(xiàn)描述性統(tǒng)計的案例回歸分析:線性回歸回歸分析:logistics回歸用SPSS實現(xiàn)回歸分析的案例可視化工具第一天下午:數(shù)據(jù)庫與數(shù)據(jù)倉庫介紹數(shù)據(jù)庫概述SQL(基本的增、刪、改、查)SQL(稍復雜的子句或嵌套)基于MySQL的上機操作SQL語言數(shù)據(jù)倉庫:度量與維度數(shù)據(jù)倉庫:星型模型、雪花模型
講師:葉梓詳情
計算機視覺(含姿態(tài)識別)-3天 03.03
計算機視覺【課程時長】3天(7小時/天)【課程對象】理工科本科及以上,且至少了解一門編程語言?!菊n程大綱】(培訓內(nèi)容可根據(jù)客戶需求調(diào)整)時間內(nèi)容案例實踐與練習Day1上午準備工作準備工作決策樹準備工作(1)概念與術語Python(Anaconda)的安裝Pycharm的安裝與使用JupyterNotebook的安裝與使用Tensorflow與pytorch的
講師:葉梓詳情
- [潘文富]煙酒店一定要靠賣酒賺錢嗎
- [潘文富]薪資考核的初步改善措施
- [潘文富]新開門店的白板期要做些什
- [潘文富]經(jīng)銷商終端建設的基本推進
- [潘文富]中小企業(yè)招聘廣告的內(nèi)容完
- [王曉楠]輔警轉(zhuǎn)正方式,定向招錄成為
- [王曉楠]西安老師招聘要求,西安各區(qū)
- [王曉楠]西安中小學教師薪資福利待遇
- [王曉楠]什么是備案制教師?備案制教
- [王曉楠]2024年陜西省及西安市最
- 1社會保障基礎知識(ppt) 21204
- 2安全生產(chǎn)事故案例分析(ppt) 20285
- 3行政專員崗位職責 19087
- 4品管部崗位職責與任職要求 16280
- 5員工守則 15491
- 6軟件驗收報告 15428
- 7問卷調(diào)查表(范例) 15157
- 8工資發(fā)放明細表 14590
- 9文件簽收單 14250