上海敏捷算法建模訓(xùn)練營周末培訓(xùn)班 2023-09-27 18:10:22
引領(lǐng)數(shù)智賦能,精通模型應(yīng)用
在數(shù)字經(jīng)濟(jì)時代,利用數(shù)字化知識可以使企業(yè)擺脫單一供給,本課程將會從企業(yè)的角度出發(fā)講解不同階段數(shù)據(jù)應(yīng)用的建設(shè)思路。同時,從找出問題→確定問題→數(shù)據(jù)清洗→數(shù)據(jù)建模→數(shù)據(jù)驗證到挖掘出有價值的數(shù)據(jù)分析思路,并確認(rèn)適合企業(yè)的解決方案。讓學(xué)員掌握可落地、易操作的數(shù)據(jù)科學(xué)思維和技術(shù)模板構(gòu)建出優(yōu)秀模型。
涵蓋常用工具,完善技術(shù)精進(jìn)
課程中涵蓋了Sklearn、LightGBM、NLP、PyTorch、Transformer等常用工具的應(yīng)用實現(xiàn),并根據(jù)輸出的結(jié)果分析業(yè)務(wù)需求,為進(jìn)行合理、有效的策略優(yōu)化提供數(shù)據(jù)支撐。在課程學(xué)習(xí)中以問題為導(dǎo)向,加強(qiáng)知識點的理解和應(yīng)用,提高學(xué)員面對復(fù)雜問題的思考能力。聚焦策略分析技術(shù)及企業(yè)常用的分類、NLP、深度學(xué)習(xí)、特征工程等數(shù)據(jù)算法,只教實用干貨,以專精技術(shù)能力提升業(yè)務(wù)效果與效率。
玩轉(zhuǎn)案例實戰(zhàn),直通企業(yè)
課程涉及大量企業(yè)項目案例:精準(zhǔn)營銷預(yù)測、營銷策略優(yōu)化、客戶行為分析、風(fēng)險管理、客戶管理、智能推薦、情感分析、反欺詐等,加持實戰(zhàn)經(jīng)驗,為學(xué)員進(jìn)入名企提供項目背書。對數(shù)據(jù)科學(xué)崗位認(rèn)知程度比較淺的學(xué)員,可在職業(yè)規(guī)劃團(tuán)隊老師的幫助下選擇適合學(xué)員的職業(yè)發(fā)展路線。進(jìn)一步從職場綜合能力要求出發(fā),通過經(jīng)驗賦能快速提升崗位匹配度。
在職提升人群
.算法建模少想獲得最優(yōu)策略算法的人員
.工作經(jīng)驗少想提升數(shù)據(jù)挖掘技能的人員
.業(yè)余時間多想提高數(shù)據(jù)思維能力的人員
在職提升和轉(zhuǎn)崗人群
.工作任務(wù)重想提高工作效率的財務(wù)、市場等人員
.競爭壓力大想突破職業(yè)瓶頸的產(chǎn)品、運營等人員
.行業(yè)挑戰(zhàn)多想提升戰(zhàn)略思維的決策、管理等人員
轉(zhuǎn)行數(shù)據(jù)分析人群
.自學(xué)難度大想零基礎(chǔ)快速入門的人員
,升職加薪難想要跳槽大幅漲薪的人員
.行業(yè)不景氣想進(jìn)新興數(shù)據(jù)行業(yè)的人員
CDA報考人群
.報名參加CDA Level|等級考試的考生
.報名參加CDA Level II等級考試的考生
.報名參加CDA Level II等級考試的考生
細(xì)分課程 | 周 | 日 | 內(nèi)容 | 詳細(xì)內(nèi)容 |
預(yù)習(xí)課 (錄播) |
|
|
數(shù)據(jù)庫SQL |
1. 數(shù)據(jù)庫基本概念 2. DDL數(shù)據(jù)定義語言 3. DML數(shù)據(jù)操作語言 4. 單表查詢 5. 多表查詢 6. Python連接SQL |
Python編程基礎(chǔ) |
1. Python標(biāo)準(zhǔn)數(shù)據(jù)類型 2. 控制流語句 3. 自定義函數(shù) 4. 異常和錯誤 5. 類與面向?qū)ο缶幊?br /> 6. Numpy數(shù)組操作 7. 用Python做數(shù)據(jù)分析,必會的庫Pandas 8. 用Pandas做數(shù)據(jù)清洗與數(shù)據(jù)探索 9. Python數(shù)據(jù)可視化庫(Matplotlib,Seaborn) |
|||
數(shù)學(xué)與統(tǒng)計學(xué)基礎(chǔ) |
1. 線性代數(shù) 2. 微積分 3. 描述性統(tǒng)計 4. 參數(shù)估計 5. 假設(shè)檢驗 6. 相關(guān)分析 7. 卡方分析 8. 一元線性回歸理論推導(dǎo) |
|||
商業(yè)策略分析 (Level 2) |
第1周 | 周六 | SQL |
1. 數(shù)據(jù)庫MySQL語句與實戰(zhàn) 2. Python連接SQL數(shù)據(jù)庫 3. SQL使用案例 4. 零售電商多表分析案例 |
周日 | 指標(biāo)體系與統(tǒng)計分析可視化 |
1. 分析基礎(chǔ)-數(shù)據(jù)分析的概念、過程、能力 2. 指標(biāo)體系的意義與構(gòu)建 3. 常用指標(biāo)體系示例 4. 統(tǒng)計分析可視化 5. 企業(yè)經(jīng)營分析-指標(biāo)體系 |
||
第2周 | 周六 | Pandas |
1. Python基礎(chǔ)與數(shù)據(jù)清洗可視化回顧 2. Python實操案例 3. 教育行業(yè)分析-學(xué)校學(xué)科教育可視化案例 4. 數(shù)據(jù)分析師崗位需求-lagou數(shù)據(jù)處理及分析案例 |
|
周日 | 方差分析,線性回歸 |
1. 方差分析 2. 線性回歸(模型的建立與估計) 3. 統(tǒng)計模型的檢驗 4. 識別分析-用戶支出影響因素分析案例 |
||
第3周 | 周六 | 邏輯回歸,主成分分析 |
1. 邏輯回歸(模型的建立與估計) 2. 模型評估 3. 信息壓縮-主成分分析與因子分析(數(shù)據(jù)降維) 4. 成交分析-Talkingviews案例 5. 因子分析-城市發(fā)展水平綜合分析 |
|
周日 | 標(biāo)簽體系與用戶畫像 |
1. 標(biāo)簽體系的設(shè)計原理 2. 用戶標(biāo)簽的制作方法 3. 客群分析-標(biāo)簽體系與用戶畫像 4. 應(yīng)用用戶畫像-信用卡持卡用戶畫像實戰(zhàn)案例 |
||
第4周 | 周六 | 時間序列 |
1. 時間序列分析(ARIMA算法) 2. Box-Jenkins 建模流程 3. 時間序列回歸 4. 銷售額預(yù)測-線上平臺銷售額預(yù)測實戰(zhàn)案例 |
|
周日 | 聚類分析,決策樹應(yīng)用 |
1. 層次聚類 2. Kmeans聚類 3. 聚類分析評價方法-決策樹應(yīng)用 4. 用戶分群-金融行業(yè)運營案例 |
||
第5周 | 周六 | 數(shù)據(jù)采集與處理,特征工程基礎(chǔ) |
1. 數(shù)據(jù)采集(概率與非概率抽樣) 2. 數(shù)據(jù)處理方法(數(shù)據(jù)錄入,數(shù)據(jù)清洗,數(shù)據(jù)編碼) 3. 特征工程基礎(chǔ)(特征預(yù)處理,特征的選擇與轉(zhuǎn)換) |
|
周日 | 數(shù)字化工作方法,最優(yōu)化方法 |
1. 數(shù)字化工作方法 2. 運籌優(yōu)化方法(線性規(guī)劃與二次優(yōu)化,基于業(yè)務(wù)流程的優(yōu)化) 3. 數(shù)字化運營綜合案例-某機(jī)構(gòu)營銷響應(yīng)概率預(yù)測與風(fēng)險預(yù)測案例 |
||
附加內(nèi)容 | 第6周 | 周六 | ETL數(shù)據(jù)接入與數(shù)倉 |
1. ETL基本概念與常用工具 2. 基于Python的ETL程序開發(fā) 3. 定時執(zhí)行Python程序 4. ETL實戰(zhàn)項目 5. 數(shù)據(jù)接入策略與調(diào)度工具 |
機(jī)器學(xué)習(xí)與人工智能 (Level 3) |
周日 | 大數(shù)據(jù)平臺Spark,數(shù)據(jù)挖掘?qū)д? |
1. 分布式存儲與計算 2. Spark與Flink工作原理 3. Spark基本語法 4. 使用PySpark實現(xiàn)分布式計算 5. 數(shù)據(jù)挖掘?qū)д?br /> 6. 梯度下降 |
|
第7周 | 周六 | 決策樹 |
1. 決策樹與信息熵 2. ID3, C4.5, CART樹 3. 模型調(diào)參:網(wǎng)格搜索 4. 決策樹的PySpark實現(xiàn) 5. 決策樹之欺詐識別案例 |
|
周日 | 正則回歸,Pipeline |
1. 正則項的理論基礎(chǔ) 2. 帶正則項的回歸 3. Pipeline工作流專題 4. 使用Pipeline提交算法模型 |
||
第8周 | 周六 | 關(guān)聯(lián)規(guī)則與協(xié)同過濾 |
1. 關(guān)聯(lián)規(guī)則(關(guān)聯(lián)規(guī)則的概念,評估指標(biāo),Apriori算法) 2. 協(xié)同過濾 3. 大數(shù)據(jù)環(huán)境下的協(xié)同過濾實現(xiàn) 4. 產(chǎn)品組合策略-零售產(chǎn)品捆綁銷售策略分析案例 |
|
周日 | 集成算法基礎(chǔ) |
1. 集成學(xué)習(xí)的理論基礎(chǔ) 2. Bagging, Boosting, Stacking 3. AdaBoost 4. 隨機(jī)森林及其Spark實現(xiàn) 5. GBDT, XGBoost |
||
第9周 | 周六 | 爬蟲,文本分析 |
1. 數(shù)據(jù)的爬取(http原理, requests應(yīng)用, HTML結(jié)構(gòu)及xpath應(yīng)用) 2, 非結(jié)構(gòu)化數(shù)據(jù)的加工處理 3. 文本數(shù)據(jù)處理之正則表達(dá)式 |
|
周日 | 機(jī)器學(xué)習(xí)進(jìn)階,人工智能基礎(chǔ) |
1. LightGBM, CatBoost 2. 數(shù)據(jù)不平衡問題 3. 貝葉斯搜索調(diào)參 4. 貝葉斯調(diào)參python實踐 5. 人工智能基礎(chǔ) 6. caie網(wǎng)頁端使用 |
||
第10周 | 周六 | 人工智能之神經(jīng)網(wǎng)絡(luò) |
1. 深度神經(jīng)網(wǎng)絡(luò)基礎(chǔ):感知器及多層感知器 2. 神經(jīng)網(wǎng)絡(luò)架構(gòu) 3. BP反向傳播算法 4. 梯度與學(xué)習(xí)率專題 5. 卷積神經(jīng)網(wǎng)絡(luò) 6. Pytorch框架與代碼實踐 7. 圖像分析-手寫數(shù)字自動識別 |
|
周日 | 聚類分析進(jìn)階與異常識別 |
1. 聚類分析進(jìn)階(密度聚類,高斯混合聚類,譜聚類) 2. 異常識別(孤立森林,局部異常因子) 3. 交易反欺詐-異常交易識別案例 |
||
第11周 | 周六 | 人工智能NLP之文本挖掘 |
1. 分詞與詞性標(biāo)注 2. 文本信息提取 3. 詞嵌入(CBOW與Skip-gram) 4. 構(gòu)建文本信息庫 5. 文本聚類算法 6. 文本分類算法與Pytorch實現(xiàn) |
|
周日 | 大型項目案例 | 實戰(zhàn)項目-金融風(fēng)控大型案例 | ||
第12周 | 周六 | 人工智能NLP之大語言模型LLM |
1. 循環(huán)神經(jīng)網(wǎng)絡(luò)RNN 2. 編碼器與遷移學(xué)習(xí) 3. 殘差網(wǎng)絡(luò)ResNet 4. 預(yù)訓(xùn)練框架Transformer 5. 大語言模型LLM技術(shù)架構(gòu)與訓(xùn)練方法 6. 開源模型平臺與框架 7. Openai api之python代碼實踐 |
|
第13周 | 周六 | 大語言模型LLM前沿方法 |
1. 知識學(xué)習(xí) 2. GPT之Fine tuning 3. LLM的本地化部署 4. 本地化LLM的Fine tuning 5. Agent 6. 向量數(shù)據(jù)庫與知識庫 7. 人工智能NLP的前沿方向 |
|
選修課 |
|
|
選修課 |
1、互聯(lián)網(wǎng)數(shù)字化運營【18課時】 2、何為數(shù)據(jù)產(chǎn)品經(jīng)理?【1課時】 3、Python爬蟲【15課時】 4、人工智能(深度學(xué)習(xí))實戰(zhàn)之圖像識別【6課時】 5、Tableau多維可視化分析【3課時】 6、SPSS統(tǒng)計分析【12課時】 |