課程詳情 學校簡介 學校地址 申請試聽
關鍵詞:大數據分析培訓班多少錢
課程名稱:Sklearn
課程類目:Sklearn
課程類型:正式課
授課形式:視頻課程
免費試聽:是
適合基礎:零基礎學員
班級名稱:中級班
上課時間:隨時可學
開班時間:隨時可學
十一周sklearn課程,讓菜菜帶你認識sklearn,帶你深入淺出地探索算法的神秘世 界。我會為你解讀sklearn中的主流算法,帶你處理數據,調整參數,完善算法,調用結果。我會為你解析參數,助你理解算法原理,也會帶你遍歷案例,帶你實戰給你刷經驗。十一周之后,人人都能夠三行實現算法,實現少加班,多鉆研,在數據行業乘風破浪的目標,為成為優 秀的數據挖掘工程師打下堅實的基礎~
使用數據科學領域切zui主流語言python及其建模庫sklearn庫座位課程核心工具,基于真實數據集和項目案例,集 合python工具與機器學習算法完成整個案例實戰
第1章: 菜菜的機器學習sklearn課程介紹
第2章: 決策樹
2.1分類樹
2.2回歸樹
2.3回歸樹案例:用回歸樹擬合正弦曲線
2.4案例:泰坦尼克號生存者預測
第3章: 隨機森林
3.1集成算法概述
3.2隨機森林分類器 、回歸器
3.3案例:用隨機森林填補缺失值
3.4機器學習中調參的基本思想
3.5案例:隨機森林在乳腺癌數據上的調參
第4章: 數據預處理和特征工程
4.1數據預處理與特征工程
4.2數據預處理:無量綱化:數據歸一化、缺失值、處理分類型數據、處理連續型數據
4.3特征選擇過濾法:方差過濾 、卡方過濾、F檢驗和互信息法、嵌入法、包裝法
第5章: 主成分分析PCA與奇異值分解SVD
5.1降維算法
5.2參數應用案例:高維數據的可視化
5.3屬性應用案例:人臉識別中的components_應用
5.4接口應用案例:用人臉識別看PCA降維后的信息保存量
5.5接口應用案例:用PCA實現手寫數字的噪音過濾
5.6總結:原理,流程,重要屬性接口和參數
5.7PCA實現784個特征的手寫數字的降維
第6章: 邏輯回歸與評分卡
6.1邏輯回歸
6.2sklearn當中的邏輯回歸
6.3二元邏輯回歸的損失函數
6.4正則化:重要參數penalty & C
6.5邏輯回歸的特征工程
6.6重要參數max_iter - 梯度下降求解邏輯回歸的過程
6.7梯度的概念與解惑、步長的概念與解惑
6.8二元回歸與多元回歸:重要參數solver & multi_class
6.9樣本不均衡與參數class_weight
6.1評分卡案例 - 評分卡與完整的模型開發流程
6.11評分卡 - 數據預處理- 重復值與缺失值、異常值
第7章: 聚類算法KMeans
7.1無監督學習概述,聚類vs分類
7.2sklearn當中的聚類算法
7.3簇內平方和,時間復雜度
7.4KMeans - 重要參數n_clusters
7.5聚類算法的模型評估指標
7.6案例:輪廓系數找zui佳n_clusters
7.7案例:Kmeans做矢量量化
第8章: 支持向量機 (上)
8.1SVM
8.2線性SVC的損失函數
8.3函數間隔與幾何間隔
8.4拉格朗日對偶函數
8.5線性SVM可視化
8.6案例:如何選取zui佳核函數
8.7案例:在乳腺癌數據集上探索核函數的性質
第9章: 支持向量機 (下)
9.1簡單復習支持向量機的基本原理
9.2參數C的深入理解:多個支持向量存在的理由
9.3二分類SVC中的樣本不均衡問題:重要參數class_weight
9.4SVC的模型評估指標
9.5混淆矩陣與準確率
9.6**度Precision、召回率Recall與F1 measure
9.7對多數類樣本的關懷:特異度Specificity與假正率FPR
9.8sklearn中的混淆矩陣
9.9ROC曲線:Recall與假正率FPR的平衡
9.1案例:預測明天是否會下雨 - 案例背景
9.11案例:導庫導數據,探索特征,jupyter中的快捷鍵
9.12案例:分集,優先處理標簽
9.13案例:描述性統計,處理異常值
9.14案例:現實數據上的數據預處理
9.15案例:現實數據集上的數據預處理 - 處理連續型變量
9.16案例:建模與模型評估
9.17案例:模型調參:追求**度與recall的平衡
第10章: 回歸大家族:線性回歸,嶺回歸,Lasso與多項式回歸
10.1課時 182 : 線性回歸大家族
10.2多元線性回歸的基本原理和損失函數
10.3回歸類模型的評估指標
10.4多重共線性:含義,數學,以及解決方案
10.5嶺回歸處理多重共線性
10.6Lasso
10.7線性數據與非線性數據
10.8線性vs非線性模型
10.9離散化:幫助線性回歸解決非線性問題
10.1多項式回歸
第11章: 樸素貝葉斯
11.1概率論基礎 - 貝葉斯理論等式
11.2瓢蟲冬眠:理解條件概率
11.3貝葉斯的性質與zui大后驗估計
11.4漢堡稱重:連續型變量的概率估計
11.5klearn中的樸素貝葉斯
11.6高斯樸素貝葉斯
11.7多項式樸素貝葉斯
11.8伯努利樸素貝葉斯
11.9補集樸素貝葉斯
11.1案例:貝葉斯做文本分類
第12章: XGBoost
CDA數據分析師
目前,CDA已與國內100多所高校進行了戰略合作,建立了CDA數據分析師考試中心及人才培養基地;已出版30多本CDA數據分析師系列叢書,市場發行量數萬冊;已進行500多期線上線下數據分析及大數據培訓課程,培養學員10萬+人次;已在全 國70+城市舉辦15屆CDA數據分析師認證考試,報考考生數萬人;已開展了四屆中 國數據分析師行業峰會(CDA SUMMIT),每屆參會人數3000多人;中 國數據分析師俱樂部(CDA CLUB)每周舉辦各類型線上線下沙龍會議、公開課等活動共1000多期。
學校榮譽
01
IBM大學戰略合作伙伴
發展歷程
02
2006年
服務內容
特色服務
2016年,CDA研究院加入由工信部指導下的“中 國大數據生態產業聯盟”理事會成員,分管教育事業。
2017年,CDA與工信部賽迪達成戰略合作推出大數據雙認證,被評為“大數據zui佳培訓機構”;
2018年,CDA入選教育部產學合作協同育人項目;
2019年,CDA獲得“2019年創新中 國·年度新商業zui具成長力項目”,“2019年沙利文中 國新經濟峰會創新領導力獎”;
2020年,榮獲“年度逆勢生長行業影響力企業”,入選北京市科學技術委員會“首批高精尖產業技能培訓機構”,成為“中 國成人教育協會”成人教育培訓機構工作委員會理事單位;
2021年,CDA數據分析師認證標準經國標委發布認定,是目前現行有效的數據分析師能力標準。
“CDA數據分析師”人才已遍布在世 界范圍各行各業,包括500強企業、科技獨角獸、大型金融機構、大型互聯網企業、國企事業單位、國 家行政機關等等。“CDA數據分析師”人才隊伍秉承著CDA職業道德準則,發揮著專業技能,已成為科技飛速發展的核心力量。
電子工業出版社 優 秀合作者
教育管理信息化專業委員會理事單位
2018年度職業教育人才培訓品牌機構
2018年度大數據影響力先鋒企業
2018入選教育部產學合作協同育人項目
網易云課堂2017年度zui佳服務獎
2017年度中 國互聯網+ zui佳培訓機構獎
中 國大數據產業生態聯盟理事單位
開展數據統計、計量實戰,學術研究等相關培訓視頻和現場班
2007年
開展數據統計、數據分析相關培訓班
2011年
隨著大數據熱潮的來臨,依托累計上萬類共享資料,多年沉淀師資團隊,論壇召集多位專家,研發CDA數據分析師體系
2013年
CDA數據分析師品牌成立,提供系統化的大數據、數據分析人才培養和認證
2014年
CDA INSTITUTE 成立 ,并推出第 一屆全 國CDA數據分析師認證考試
2015年
第 一屆中 國數據分析師行業峰會(CDAS)在9月11日成功舉辦,參會人數逾3000人
2016年
CDA匯聚海內外大數據、數據分析專家上千人,推出就業班、數據科學家訓練營、企業內訓、CDA俱樂部等多個項目
2017年
整合論壇與CDA數據分析師業內資源,形成數據分析領域生態圈,并進一步升級CDA企業內訓體系,正式推出大數據實驗室
2018年
北上廣深等多個城市均有校區;擁有200多位專業師資;培養學員超過3萬人,每年6月/12月全 國28個城市舉辦CDA認證考試
2019年
已舉辦九屆數據分析師認證考試,得到業界廣泛認可,學員遍布各大知名企業。人工智能產品“好學AI”問世,引領DT時代新一波技術培訓浪潮
數據分析、大數據、人工智能、互聯網運營培訓
免費試聽,免費重讀,小班授課,一對一教學,推薦就業
學校名稱:北京CDA數據分析師培訓機構
固定電話:400-001-5729
授課地址:北京市海淀區中坤大廈 預約參觀