大數(shù)據(jù)時代的數(shù)據(jù)挖掘及案例(含CRISP-DM方法論)內(nèi)訓

  培訓講師:馬兆林

講師背景:
馬兆林移動互聯(lián)網(wǎng)頂層贏利智慧研究院院長中關村大數(shù)據(jù)產(chǎn)業(yè)研究會理事北大縱橫咨詢集團事業(yè)合伙人中國教育戰(zhàn)略發(fā)展學會委員中國策劃聯(lián)盟委員中國企業(yè)培訓師聯(lián)合會執(zhí)行理事曾任:安邦金融集團網(wǎng)絡信息中心負責人北大縱橫咨詢事業(yè)合伙人國家軟實力課題組、北京大 詳細>>

馬兆林
    課程咨詢電話:

大數(shù)據(jù)時代的數(shù)據(jù)挖掘及案例(含CRISP-DM方法論)內(nèi)訓詳細內(nèi)容

大數(shù)據(jù)時代的數(shù)據(jù)挖掘及案例(含CRISP-DM方法論)內(nèi)訓

課程內(nèi)容:

一、“大數(shù)據(jù)、大機會”:

1.概述

1)大數(shù)據(jù)概念和特點

2)大數(shù)據(jù)需要哪些技術支撐

3)大數(shù)據(jù)能夠帶來哪些新應用?

2.大數(shù)據(jù)時代帶來對傳統(tǒng)營銷的挑戰(zhàn)

1)大數(shù)據(jù)如何成為資產(chǎn)?——GOOGLE的市值遠超過制造企業(yè)

2)大數(shù)據(jù)如何體現(xiàn)精細營銷

3)大數(shù)據(jù)的價值——靠空調電表判斷氣候趨勢(“指數(shù)”)

3.大數(shù)據(jù)時代的“互聯(lián)網(wǎng)思維”營銷模式

1) 互聯(lián)網(wǎng)思維——先圈用戶再掙錢

2)互聯(lián)網(wǎng)的營銷模式——微博營銷、網(wǎng)頁營銷等

3) CRM——“舊貌煥發(fā)新顏”

4)精細營銷——裝上了GPS,實現(xiàn)“精確打擊”

4.如何在海量數(shù)據(jù)中整合線上、線下數(shù)據(jù),形成你對客戶的獨特洞察力

1)知道客戶的各個屬性——互聯(lián)網(wǎng)時代不再“是否是狗”

2)客戶的群體特征——“人以群分”

5.如何建立產(chǎn)品分析的數(shù)據(jù)平臺,提供產(chǎn)品的“標尺” 

1)產(chǎn)品的數(shù)據(jù)有哪些?

2)產(chǎn)品設計的互聯(lián)網(wǎng)思維?——小米手機

3)產(chǎn)品的大數(shù)據(jù)分析——哪些維度?

4)如何“產(chǎn)品為中心”發(fā)展為“客戶為中心”?——有數(shù)據(jù)就有可能

6.大數(shù)據(jù)對企業(yè)的精細管理提升

1)企業(yè)的精細管理——不再盲人摸象

2)企業(yè)的KPI儀表板——進入駕駛艙

3)預防企業(yè)的管理風險——早診斷、早發(fā)現(xiàn)

4)員工的量化績效評定——計件之后計量

7.大數(shù)據(jù)提升企業(yè)的產(chǎn)品質量

1)建立量化的產(chǎn)品管理方法——辣椒的辣度評定

2)產(chǎn)品制造過程的管理控制——監(jiān)控大數(shù)據(jù)分析

3)產(chǎn)品問題的及時監(jiān)控——溫度、風速等異常早發(fā)現(xiàn)

4)產(chǎn)品訂制的范例——好萊塢大片的大數(shù)據(jù)

5)產(chǎn)品質量的量化管控——擋板安裝的故事


二、大數(shù)據(jù)的“數(shù)據(jù)挖掘技術”

1. 數(shù)據(jù)挖掘概述

1)基本概念——“啤酒和尿布的故事”

2)與講師系統(tǒng)、統(tǒng)計分析、人工智能的關系——演進歷史分析

3)數(shù)據(jù)挖掘在制造行業(yè)的應用內(nèi)容——如何體現(xiàn)“智能制造”?

2. CRISP-DM過程描述

1)商業(yè)理解——要實現(xiàn)什么“目的”?

2)數(shù)據(jù)的理解以及收集——手里有哪些數(shù)據(jù)?

3)數(shù)據(jù)的準備——數(shù)據(jù)的清洗及轉換

4)應用數(shù)據(jù)挖掘工具建立模型——使用哪種數(shù)據(jù)挖掘算法和工具?

5)模型評估——算法評估

6)部署(并形成數(shù)據(jù)挖掘報告)——實際使用及形成報告

3. 數(shù)據(jù)挖掘常用算法介紹

預測型

1)分類算法

2)回歸分析

3)時間序列

描述型

4)關聯(lián)分析

5)序列關聯(lián)分析

6)聚類分析

4.數(shù)據(jù)挖掘具體算法舉例

1)神經(jīng)網(wǎng)絡算法

2)決策樹算法

5.根據(jù)實際問題選擇數(shù)據(jù)挖掘算法

1)客戶離網(wǎng)分析

2)客戶分群模型

3)產(chǎn)品關聯(lián)分析

4)問題的描述

需要解決的關鍵問題

如何轉換成為數(shù)據(jù)挖掘的描述

數(shù)據(jù)挖掘算法的選擇依據(jù)

預測類還是描述類

與各種算法的使用特點結合

6.分析結果的檢驗

對照組數(shù)據(jù)的選擇方法

對照組數(shù)據(jù)的時間窗口選擇

對照組數(shù)據(jù)的抽樣

數(shù)據(jù)挖掘模型的修訂

1)如何剔除無效的結果數(shù)據(jù)

2) 根據(jù)反饋結果進行模型修訂

7.數(shù)據(jù)挖掘項目的投入產(chǎn)出

數(shù)據(jù)挖掘項目的投入成本計算

數(shù)據(jù)挖掘項目的產(chǎn)出計算依據(jù)

8. 如何形成分析報告

1)分析報告的組成部分

2)部分優(yōu)秀的分析報告演示

9.常用數(shù)據(jù)挖掘工具介紹

1)SAS

2 ) SPSS


三、數(shù)據(jù)挖掘具體案例分析

某電信公司具體數(shù)據(jù)挖掘案例(某產(chǎn)品營銷)詳細舉例

1. 商業(yè)理解:提升哪個KPI指標?(ARPU/MOU等)

2. 數(shù)據(jù)理解及收集:哪些具體的數(shù)據(jù)(客戶詳單、客戶資料等)

3. 數(shù)據(jù)準備:

1)客戶數(shù)據(jù)質量分析

如何保障數(shù)據(jù)質量——哪些衡量指標

如何發(fā)現(xiàn)異常數(shù)據(jù)——剔除干擾數(shù)據(jù)

2)客戶數(shù)據(jù)抽樣過程

抽樣比例分析

抽樣的具體方法

3)挖掘應用需求描述

如何篩選有用數(shù)據(jù)——選擇相關變量和匯總數(shù)據(jù)

如何描述需求

4.數(shù)據(jù)挖掘工具建立模型

挖掘算法選擇

如何選擇合適的分析方法

如何剔除無效的干擾數(shù)據(jù)

選擇關鍵變量

挖掘具體過程

結果數(shù)據(jù)分析

5.模型(算法)評估

LIFT值等分析

6.實際部署及分析報告

實際分析報告編寫示例

如何計算該項目的投入、產(chǎn)出

項目的投入計算依據(jù)

項目的產(chǎn)出計算方法

項目的投入/產(chǎn)出結果


四、基礎數(shù)據(jù)的收集和整理

1、數(shù)據(jù)的種類

1)客戶數(shù)據(jù)內(nèi)容(保險客戶的基本資料)

2)產(chǎn)品數(shù)據(jù)內(nèi)容(產(chǎn)品的編碼)

3)營銷數(shù)據(jù)內(nèi)容(交易記錄的保存)

4)服務數(shù)據(jù)內(nèi)容(客戶服務數(shù)據(jù)的保存)

5)制造行業(yè)數(shù)據(jù)的特點:(數(shù)據(jù)類型雜、數(shù)據(jù)量大等)

2、數(shù)據(jù)的存放方法

1)數(shù)據(jù)的清洗、轉換和加載

2)存放在數(shù)據(jù)庫/數(shù)據(jù)倉庫

3)數(shù)據(jù)的基本分析工具EXCEL等

3、數(shù)據(jù)的基本整理

1)數(shù)據(jù)的歸類存放(建模型)

2)數(shù)據(jù)的基本加工

4、數(shù)據(jù)的基礎分析

1)數(shù)據(jù)的基本匯總

2)數(shù)據(jù)中的“金子”:從石頭中淘金子

5、數(shù)據(jù)質量的基本保障

1)指標的口徑描述和統(tǒng)一

2)后期補數(shù)據(jù)成本是前提收集數(shù)據(jù)成本的15倍

3)“差之毫厘謬以千里”

6、制造業(yè)企業(yè)數(shù)據(jù)的收集和整理

1)制造環(huán)境的數(shù)據(jù)收集/整理

2)采購數(shù)據(jù)的收集/整理

3)營銷數(shù)據(jù)的收集/整理:

4)人力資源數(shù)據(jù)的收集/整理

示例:某企業(yè)的數(shù)據(jù)收集/整理方案


五、云計算技術

1.Hadoop項目簡介

2.HDFS體系結構

3.HDFS關鍵運行機制

4.MapReduce產(chǎn)生背景

5.MapReduce編程模型

6.MapReduce實現(xiàn)機制

7.MapReduce案例分析

8.HIVE介紹

9.HBASE介紹


六、總結和展望

 

馬兆林老師的其它課程

中國式現(xiàn)代化愿景下的新型工業(yè)化發(fā)展課程背景:中國式現(xiàn)代化是工業(yè)化、信息化、城鎮(zhèn)化、農(nóng)業(yè)現(xiàn)代化疊加發(fā)展的現(xiàn)代化,對創(chuàng)新現(xiàn)代化發(fā)展進程具有重要啟示意義。目前中國是全球最大的制造業(yè)國家,大多數(shù)中國工廠并沒有掌握制造的核心材料、設備,以及工藝,他們?nèi)匀煌A粼诮M裝加工的階段,缺乏原創(chuàng)技術、缺乏創(chuàng)新。面對工業(yè)4.0和工業(yè)互聯(lián)網(wǎng)的新工業(yè)革命大潮,中國是否會喪失制造業(yè)大國的

 講師:馬兆林詳情


銀行網(wǎng)絡信息安全培訓課程背景:銀行加強信息安全主要目的是為了保障信息化的持續(xù)穩(wěn)定發(fā)展,網(wǎng)絡信息安全不僅屬于技術問題,也屬于管理問題。網(wǎng)絡信息安全的構建,是大數(shù)據(jù)時代網(wǎng)絡信息技術的發(fā)展安全,也是確保金融企業(yè)網(wǎng)絡環(huán)境安全有序重要保障。課程時間:3小時課程形式:以講授為主,結合案例分析、體驗游戲、視頻觀賞等形式。授課講師:馬兆林(簡介略)課程大綱銀行網(wǎng)絡安全概述我

 講師:馬兆林詳情


數(shù)字化項目管理數(shù)字化中的項目管理幾個方面、工具支撐導入:項目風險(經(jīng)濟背景),EDS界面數(shù)字化工具,不能太微觀財務管理,共性特性這怎么呈現(xiàn)?怎么匹配學員的剛需?課程背景:數(shù)字化項目管理是項目管理在數(shù)字化領域的應用,結合數(shù)字化行業(yè)特點運用項目管理技術、理念和方法,包括9大領域(項目綜合、范圍、時間、成本、質量、人力資源、溝通、風險和采購管理)以及啟動、計劃、實

 講師:馬兆林詳情


數(shù)據(jù)治理數(shù)據(jù)治理課程是ICCP的一門認證課程。學員掌握數(shù)據(jù)治理與管理的知識體系,提高數(shù)據(jù)資產(chǎn)的管理能力。深刻理解數(shù)據(jù)治理為企業(yè)戰(zhàn)略目標實現(xiàn)帶來的價值。經(jīng)認證考試后可收獲國際認可的數(shù)據(jù)治理與管理(DGSP)培訓和認證證書。培訓時長:6小時授課內(nèi)容數(shù)據(jù)治理和管理核心概念數(shù)據(jù)管理和數(shù)據(jù)治理數(shù)據(jù)治理業(yè)務驅動因素和其他概念數(shù)據(jù)管理范圍和組織數(shù)據(jù)治理角色和其他計劃元素數(shù)

 講師:馬兆林詳情


數(shù)據(jù)資產(chǎn)管理-數(shù)據(jù)治理數(shù)據(jù)治理課程是ICCP的一門認證課程。學員掌握數(shù)據(jù)治理與管理的知識體系,提高數(shù)據(jù)資產(chǎn)的管理能力。深刻理解數(shù)據(jù)治理為企業(yè)戰(zhàn)略目標實現(xiàn)帶來的價值。經(jīng)認證考試后可收獲國際認可的數(shù)據(jù)治理與管理(DGSP)培訓和認證證書。培訓時長:3-6小時授課內(nèi)容數(shù)據(jù)治理和管理核心概念數(shù)據(jù)管理和數(shù)據(jù)治理數(shù)據(jù)治理業(yè)務驅動因素和其他概念數(shù)據(jù)管理范圍和組織數(shù)據(jù)治理角

 講師:馬兆林詳情


ITIL運維管理課程內(nèi)容ITIL是一種全新的、基于流程的IT管理模式,可快速幫助企業(yè)IT部門從職能/后勤部門轉型為服務部門,并實現(xiàn)規(guī)范、精細、可量化的IT管理,提供可保證的IT服務質量。ITIL是ITSM流程中最核心的一組,已有近20年的全球應用歷史,并于2005年被批準為國際標準ISO20000。適合對象CIO、IT運維經(jīng)理、網(wǎng)絡管理員;數(shù)據(jù)中心經(jīng)理;IT

 講師:馬兆林詳情


前沿技術及應用課程背景:學習前沿科技新技術,量子科技、元宇宙、數(shù)字孿生、結合案例、深入研討智能化創(chuàng)新制造工業(yè)產(chǎn)業(yè)發(fā)展。課程時間:6小時課程形式:以講授為主,結合案例分析、互動體驗等形式。課程對象:適合學習前沿技術創(chuàng)新轉型變革所有相關人員主訓導師:馬兆林(簡介略)課程大綱:人工智能技術與應用機器學習與深入學習文字識別、圖像識別、語音識別、視頻標注應用NLP/O

 講師:馬兆林詳情


ITILV4foundation課程內(nèi)容ITIL是一種全新的、基于流程的IT管理模式,可快速幫助企業(yè)IT部門從職能/后勤部門轉型為服務部門,并實現(xiàn)規(guī)范、精細、可量化的IT管理,提供可保證的IT服務質量。ITIL是ITSM流程中最核心的一組,已有近20年的全球應用歷史,并于2005年被批準為國際標準ISO20000。適合對象CIO、IT運維經(jīng)理、網(wǎng)絡管理員;數(shù)

 講師:馬兆林詳情


AI技術及汽車行業(yè)應用課程背景:人工智能技術拉開新工業(yè)革命的序幕,隨著機器人技術、語音圖像識別技術、專家系統(tǒng)等人工智能技術逐步突破,日臻完善,并以前所未有的廣度運用到汽車行業(yè)的智能化應用,高度智能化的汽車行業(yè)將會以革命性的姿態(tài)影響人們的工作和生活,迎來汽車產(chǎn)業(yè)大機遇。課程目標:通過人工智能技術體系的介紹以及當前行業(yè)內(nèi)的應用案例,導入數(shù)字化意識,激活思維課程時

 講師:馬兆林詳情


云計算市場趨勢研究及商模營銷策略-馬兆林計算機行業(yè)過去十年回顧技術變革推動行業(yè)發(fā)展計算機行業(yè)持續(xù)增長,云服務為重要增長動力計算機行業(yè)市值持續(xù)上升,占比呈現(xiàn)上升趨勢計算機行業(yè)收入規(guī)模及公司數(shù)量持續(xù)上升計算機行業(yè)市場規(guī)模不斷擴大計算機市場競爭格局:龍頭公司隨行業(yè)發(fā)展而變遷云計算商模營銷策略變革計算機行業(yè)商業(yè)模式:從軟件向云變遷變化背后的原因:技術變革為計算機行業(yè)

 講師:馬兆林詳情


COPYRIGT @ 2001-2018 HTTP://musicmediasoft.com INC. ALL RIGHTS RESERVED. 管理資源網(wǎng) 版權所有