国产 欧美 日韩 精品 二卡_欧美 亚洲 国产 日韩一区二区_日本NV精品在线看_亚洲AV成人无码网站一区二区_亚洲欧美日韩免费电影_国产精品国产三级国产av丨_西川结衣在线观看_久久精品亚洲无码老影院_免费高清欧美精品黄片_日本中文字幕爆乳

4006-900-901

Python實現大數據挖掘技術培訓

參加對象:業(yè)務支持部、IT系統(tǒng)部、大數據系統(tǒng)開發(fā)部、大數據分析中心、網絡運維部等相關技術人員。
課程費用:電話咨詢
授課天數:2~5天
授課形式:內訓
聯系電話:4006-900-901 / 17821361800(小威)

微信咨詢&報名

課程背景  COURSE BACKGROUND

Python已經成為數據分析和數據挖掘的首選語言,作為除了Java、C/C++/C#外最受歡迎的語言。
本課程基于Python工具來實現大數據的數據分析和數據挖掘項目?;跇I(yè)務問題,在數據挖掘標準過程指導下,采用Python分析工具,實現數據挖掘項目的每一步操作,從數據預處理、數據建模、數據可視化,到最終數據挖掘結束,幫助學員掌握Python用于數據挖掘,提升學員的數據化運營及數據挖掘的能力。

課程收益  PROGRAM BENEFITS

全面掌握Python語言以及其編程思想。
掌握常用擴展庫的使用,特別是數據挖掘相關庫的使用。
學會使用Python完成數據挖掘項目整個過程。
掌握利用Python實現可視化呈現。
掌握數據挖掘常見算法在Python中的實現。

課程大綱  COURSE OUTLINE

數據對象基本操作
目的:掌握數據集結構及基本處理方法,進一步鞏固Python語言
數據挖掘常用擴展庫介紹
Numpy數組處理支持
Scipy矩陣計算模塊
Matplotlib數據可視化工具庫
Pandas數據分析和探索工具
StatsModels統(tǒng)計建模庫
Scikit-Learn機器學習庫
Keras深度學習(神經網絡)庫
Gensim文本挖掘庫
數據集構建
Index, Series, DataFrame對象
手工構建(創(chuàng)建索引、序列、數據集)
讀取文件(CSV文件、Excel文件)
讀取數據庫
數據集保存(CSV、Excel)
數據集基本操作
基本屬性訪問
shape,ndim,index,columns,values,empty,size
數據類型處理:查看、修改、轉換
排序
排序依據:標題、索引、字段
排序順序:升序、降序
自定義排序:按標題、索引、字段、有序類別變量排序
基本訪問
行訪問、列訪問、值訪問
訪問方式:標簽、位置
訪問類型:單行列、多行列、連續(xù)行列
布爾數組訪問
字段管理、新增、刪除、修改、替換、移位
數據篩選:條件篩選、多值篩選、篩選空值/非空值
演練:用Python實現數據的基本訪問

大數據預處理
目的:掌握數據預處理的基本環(huán)節(jié),以及Python的實現。
預處理任務
數據清洗
數據集成
數據處理
變量處理
數據清洗
重復值處理
重復字段、重復標題、重復索引
處理方式:查找、刪除、修改
錯誤值處理
查找錯誤值
置空/刪除
重新編碼/替換
離群值處理:
檢測標題:3σ準則,IQR準則,K均值
處理方式:查找、置空、截尾、縮尾
基于K均值的離群值檢測
缺失值處理:
查找、刪除
插補(固定值/均值/向下填充/向上填充/插入法/拉格朗日)
數據集成
數據追加
變量合并(連接類型)
數據處理
數據篩選
數據抽樣
簡單抽樣(有放回、無放回)
分層抽樣
離散化/分箱
等寬
等頻
自定義間隔
K均值
變量處理
處理方式:變量變換、變量派生
規(guī)范化:min-max /mean-std/exp-max
啞變量化
案例:用Python實現數據預處理

數據可視化處理
目的:掌握作圖擴展庫,實現數據可視化
統(tǒng)計基礎
數值變量:描述統(tǒng)計
類別變量:分類計數
分類統(tǒng)計:分類匯總
常用的Python作圖庫
Matplotlib庫
Pygal庫
各種圖形的畫法
柱狀圖
直方圖
餅圖
折線圖
散點圖

演練:用Python庫作圖來實現產品銷量分析,并可視化
影響因素分析/特征選擇
目的:掌握判斷事物間相關性的常用方法,熟悉建模前如何進行屬性篩選/特征選擇,以實現降維的目的。
影響因素分析常用方法
相關分析
相關分析原理
相關系數公式種類
Pearson相關系數
Spearman等級相關系數
Kendall等級相關系數
方差分析
方差分析原理
方差分析種類
單因素方差分析
多因素方差分析
協(xié)方差分析
列聯分析/卡方檢驗
列聯分析原理
計數與期望值
卡方檢驗公式
主成分分析:降維
PCA方法原理

回歸預測模型實戰(zhàn)
常用數值預測的模型
通用預測模型:回歸模型
季節(jié)性預測模型:相加、相乘模型
新產品預測模型:珀爾曲線與龔鉑茲曲線
回歸分析概念
常見回歸分析類別
回歸分析常見算法
普通最小二乘法OLS
嶺回歸(RR)
套索回歸Lasso
ElasticNet回歸
回歸模型的評估
判定系數R^2
平均誤差率MAPE
分類預測模型實戰(zhàn)
常見分類預測的模型與算法
如何評估分類預測模型的質量
正確率、查準率、召回率、F1
ROC曲線
邏輯回歸分析模型
邏輯回歸的原理
邏輯回歸建模的步驟
案例:用sklearn庫實現銀行貸款違約預測
決策樹模型
決策樹分類的原理
決策樹的三個關鍵問題
決策樹算法與實現
案例:電力竊漏用戶自動識別
決策樹算法
最優(yōu)屬性選擇算法:ID3、ID4.0、ID5.0
連續(xù)變量分割算法
樹剪枝:預剪枝、后剪枝
人工神經網絡模型(ANN)
神經網絡概述
神經元工作原理
常見神經網絡算法(BP、LM、RBF、FNN等)
案例:神經網絡預測產品銷量
支持向量機(SVM)
SVM基本原理
維災難與核心函數
案例:基于水質圖像的水質評價
貝葉斯分析
條件概率
常見貝葉斯網絡

聚類分析(客戶細分)實戰(zhàn)
客戶細分常用方法
聚類分析(Clustering)
聚類方法原理介紹及適用場景
常用聚類分析算法
聚類算法的評價
案例:使用SKLearn實現K均值聚類
案例:使用TSNE實現聚類可視化
RFM模型分析
RFM模型,更深入了解你的客戶價值
RFM模型與市場策略
案例:航空公司客戶價值分析

關聯規(guī)則分析實戰(zhàn)
關聯規(guī)則概述
常用關聯規(guī)則算法
Apriori算法
發(fā)現頻繁集
生成關聯規(guī)則
FP-Growth算法
構建FP樹
提取規(guī)則
時間序列分析
案例:使用apriori庫實現關聯分析
案例:中醫(yī)證型關聯規(guī)則挖掘

案例實戰(zhàn)
客戶流失預測和客戶挽留模型
銀行欠貸風險預測模型

結束:課程總結與問題答疑。

我們的服務  OUR SERVICES
服務流程

業(yè)務范疇
量身定制化的經典內訓課程
人力資源
勞動法
培訓發(fā)展
職業(yè)技能
市場營銷
經營股權
戰(zhàn)略管理
行政商務
財務管理
研發(fā)管理
生產管理
物流管理
采購管理
職業(yè)素養(yǎng)
通用管理
獨具特色的系統(tǒng)解決方案
人力資源
勞動法
企業(yè)文化
戰(zhàn)略經營
組織變革
股權激勵
領導力
技術研發(fā)
財務管理
生產管理
聯系我們   CONTACT US

聯系電話:4006-900-901

微信咨詢:威才客服

企業(yè)郵箱:shwczx@shwczx.com


?

1.點擊下面按鈕復制微信號

13812819979

點擊復制微信號

上海威才企業(yè)管理咨詢有限公司