大數據時代的數據挖掘分析及案例(含CRISP-DM方法論)內訓

  培訓講師:段方

講師背景:
段方專業(yè)背景:曾在中國銀行工作現任某集團總部大數據專家、數據倉庫項目經理多家培訓機構及大學總裁班特邀講師十幾年專注于大數據的研究與推廣積累了15年的大數據領域的實際工作經驗。帶領相關的團隊,從系統(tǒng)創(chuàng)建到系統(tǒng)運營,開發(fā)了很多大數據領域的各種應 詳細>>

段方
    課程咨詢電話:

大數據時代的數據挖掘分析及案例(含CRISP-DM方法論)內訓詳細內容

大數據時代的數據挖掘分析及案例(含CRISP-DM方法論)內訓

一、“大數據、大機會”:

1.概述

1)大數據概念和特點

2)大數據需要哪些技術支撐

3)大數據能夠帶來哪些新應用?

2.大數據時代帶來對傳統(tǒng)營銷的挑戰(zhàn)

1)大數據如何成為資產?——GOOGLE的市值遠超過制造企業(yè)

2)大數據如何體現精細營銷

3)大數據的價值——靠空調電表判斷氣候趨勢(“指數”)

3.大數據時代的“互聯(lián)網思維”營銷模式

1) 互聯(lián)網思維——先圈用戶再掙錢

2)互聯(lián)網的營銷模式——微博營銷、網頁營銷等

3) CRM——“舊貌煥發(fā)新顏”

4)精細營銷——裝上了GPS,實現“精確打擊”

4.如何在海量數據中整合線上、線下數據,形成你對客戶的獨特洞察力

1)知道客戶的各個屬性——互聯(lián)網時代不再“是否是狗”

2)客戶的群體特征——“人以群分”

5.如何建立產品分析的數據平臺,提供產品的“標尺” 

1)產品的數據有哪些?

2)產品設計的互聯(lián)網思維?——小米手機

3)產品的大數據分析——哪些維度?

4)如何“產品為中心”發(fā)展為“客戶為中心”?——有數據就有可能

6.大數據對企業(yè)的精細管理提升

1)企業(yè)的精細管理——不再盲人摸象

2)企業(yè)的KPI儀表板——進入駕駛艙

3)預防企業(yè)的管理風險——早診斷、早發(fā)現

4)員工的量化績效評定——計件之后計量

7.大數據提升企業(yè)的產品質量

1)建立量化的產品管理方法——辣椒的辣度評定

2)產品制造過程的管理控制——監(jiān)控大數據分析

3)產品問題的及時監(jiān)控——溫度、風速等異常早發(fā)現

4)產品訂制的范例——好萊塢大片的大數據

5)產品質量的量化管控——擋板安裝的故事


二、大數據的“數據挖掘技術”

1. 數據挖掘概述

1)基本概念——“啤酒和尿布的故事”

2)與講師系統(tǒng)、統(tǒng)計分析、人工智能的關系——演進歷史分析

3)數據挖掘在制造行業(yè)的應用內容——如何體現“智能制造”?

2. CRISP-DM過程描述

1)商業(yè)理解——要實現什么“目的”?

2)數據的理解以及收集——手里有哪些數據?

3)數據的準備——數據的清洗及轉換

4)應用數據挖掘工具建立模型——使用哪種數據挖掘算法和工具?

5)模型評估——算法評估

6)部署(并形成數據挖掘報告)——實際使用及形成報告

3. 數據挖掘常用算法介紹

預測型

1)分類算法

2)回歸分析

3)時間序列

描述型

4)關聯(lián)分析

5)序列關聯(lián)分析

6)聚類分析

4.數據挖掘具體算法舉例

1)神經網絡算法

2)決策樹算法

5.根據實際問題選擇數據挖掘算法

1)客戶離網分析

2)客戶分群模型

3)產品關聯(lián)分析

4)問題的描述

需要解決的關鍵問題

如何轉換成為數據挖掘的描述

數據挖掘算法的選擇依據

預測類還是描述類

與各種算法的使用特點結合

6.分析結果的檢驗

對照組數據的選擇方法

對照組數據的時間窗口選擇

對照組數據的抽樣

數據挖掘模型的修訂

1)如何剔除無效的結果數據

2) 根據反饋結果進行模型修訂

7.數據挖掘項目的投入產出

數據挖掘項目的投入成本計算

數據挖掘項目的產出計算依據

8. 如何形成分析報告

1)分析報告的組成部分

2)部分優(yōu)秀的分析報告演示

9.常用數據挖掘工具介紹

1)SAS

2 ) SPSS


三、數據挖掘具體案例分析

某電信公司具體數據挖掘案例(某產品營銷)詳細舉例

1. 商業(yè)理解:提升哪個KPI指標?(ARPU/MOU等)

2. 數據理解及收集:哪些具體的數據(客戶詳單、客戶資料等)

3. 數據準備:

1)客戶數據質量分析

如何保障數據質量——哪些衡量指標

如何發(fā)現異常數據——剔除干擾數據

2)客戶數據抽樣過程

抽樣比例分析

抽樣的具體方法

3)挖掘應用需求描述

如何篩選有用數據——選擇相關變量和匯總數據

如何描述需求

4.數據挖掘工具建立模型

挖掘算法選擇

如何選擇合適的分析方法

如何剔除無效的干擾數據

選擇關鍵變量

挖掘具體過程

結果數據分析

5.模型(算法)評估

LIFT值等分析

6.實際部署及分析報告

實際分析報告編寫示例

如何計算該項目的投入、產出

項目的投入計算依據

項目的產出計算方法

項目的投入/產出結果


四、基礎數據的收集和整理

1、數據的種類

1)客戶數據內容(保險客戶的基本資料)

2)產品數據內容(產品的編碼)

3)營銷數據內容(交易記錄的保存)

4)服務數據內容(客戶服務數據的保存)

5)制造行業(yè)數據的特點:(數據類型雜、數據量大等)

2、數據的存放方法

1)數據的清洗、轉換和加載

2)存放在數據庫/數據倉庫

3)數據的基本分析工具EXCEL等

3、數據的基本整理

1)數據的歸類存放(建模型)

2)數據的基本加工

4、數據的基礎分析

1)數據的基本匯總

2)數據中的“金子”:從石頭中淘金子

5、數據質量的基本保障

1)指標的口徑描述和統(tǒng)一

2)后期補數據成本是前提收集數據成本的15倍

3)“差之毫厘謬以千里”

6、制造業(yè)企業(yè)數據的收集和整理

1)制造環(huán)境的數據收集/整理

2)采購數據的收集/整理

3)營銷數據的收集/整理:

4)人力資源數據的收集/整理

示例:某企業(yè)的數據收集/整理方案


五、云計算技術

1.Hadoop項目簡介

2.HDFS體系結構

3.HDFS關鍵運行機制

4.MapReduce產生背景

5.MapReduce編程模型

6.MapReduce實現機制

7.MapReduce案例分析

8.HIVE介紹

9.HBASE介紹


六、總結和展望


 

段方老師的其它課程

《“連接+算力+能力”——移動公司新戰(zhàn)略》-段方某世界100強企業(yè)大數據/AI總設計師教授北京大學博士后===========================================================概述-------------------------------------------------------------1.1中國移

 講師:段方詳情


《大數據系列培訓的課程目錄》——段方段方——北京大學博士后摘要列出大數據系列課程目錄,從不同角度詳細介紹大數據的各種相關內容。從實際案例出發(fā),分享實際建設、運營的經驗和教訓,分享個人的思考?!局v師簡介】30余年計算機(IT)領域從業(yè)經歷,直至博士后的學歷背景;16年大數據系統(tǒng)(含數據倉庫)設計、建設、應用、管理、運營實際經驗,累計投資120億元買來的教訓;2

 講師:段方詳情


《基于大數據的機器學習和深度學習》——原理與實踐目錄1背景1.1從AlphaGo說起5\lquot;bookmark6quot;1.1.1AlphaGo的效果5\lquot;bookmark8quot;1.1.2AlphaGo的原理5\lquot;bookmark10quot;1.2機器學習基礎5\lquot;bookmark12quot;1.2.1機器學習

 講師:段方詳情


《物聯(lián)網技術與應用》段方——北京大學博士后目錄1概述1.1物聯(lián)網概念及特點1.1.1定義1.1.2與互聯(lián)網的關系1.1.3物聯(lián)網的特點1.2物聯(lián)網發(fā)展歷程1.2.1源起1.2.2中國移動的“萬物互聯(lián)”1.3物聯(lián)網關鍵技術1.3.1從RFID開始1.3.2感應識別技術1.3.3定位系統(tǒng)1.3.4其它的感應技術1.4物聯(lián)網的產業(yè)鏈1.4.1設備層面1.4.2網絡

 講師:段方詳情


=============================================================《人工智能(含機器學習)及其在電信領域應用》-段方某世界100強企業(yè)大數據/AI總設計師教授、北京大學博士后=============================================================1930

 講師:段方詳情


=============================================================《中國廣電5G運營策略》——段方中國移動資深專家教授北京大學博士后=============================================================15G發(fā)展概述1.15G概述1.25G技術特征1.

 講師:段方詳情


=============================================================《人工智能基礎及應用培訓》-段方某世界100強大數據/AI總設計師教授北京大學博士后=============================================================202916811801概述--

 講師:段方詳情


數據安全技術   04.24

《數據安全技術》-段方某世界100強企業(yè)大數據總設計師教授北京大學博士后1概述1.1信息安全的概念及范圍1.1.1概述1.1.2信息系統(tǒng)潛在威脅被動攻擊主動攻擊黑客攻擊手法1.1.3信息安全技術概覽1.1.4信息安全注重體系安全防護檢測響應恢復1.2信息安全等級分類1.2.1分級的概念1.2.2分級保護涉及的標準1.2.3職責和角色1.2.4企業(yè)信息等級選擇

 講師:段方詳情


=============================================================《數據管理及數倉建?!?段方某世界100強企業(yè)大數據/AI總設計師教授北京大學博士后=============================================================13465791461概述---

 講師:段方詳情


=============================================================《數智化發(fā)展及運用案例分析》-段方某世界100強企業(yè)大數據/AI總設計師教授北京大學博士后=============================================================23704858471概念

 講師:段方詳情


COPYRIGT @ 2001-2018 HTTP://www.musicmediasoft.com INC. ALL RIGHTS RESERVED. 管理資源網 版權所有