Python及數據分析培訓大綱
1.Python概覽
1.1為什么使用Python
1.2重要的Python庫
NumPy
Pandas
SciPy
Matplotlib
1.3IPython
1.4 Python IDE的下載與安裝
2.Python語言快速入門
2.1Python解釋器
2.2語言設計特點
2.3對象的調用和屬性
2.4import引入
2.5數據類型
2.6控制流
2.7數據結構和序列
2.8函數
2.9 文件和操作系統
3.IPython使用
3.1啟動和運行
3.2對象內省
3.3異常和跟蹤
3.4與操作系統交互
3.5測試代碼執行時間
3.6IPython HTML Notebook
3.7利用IPython提高代碼效率的幾點提示
4.NumPy 4.1ndarray多維數組對象處理與運算
4.2元素級數組函數
4.3利用數組進行數據處理
4.4利用數組進行輸入和輸出
4.5線性代數
4.6隨機數生成
5.Pandas 5.1Pandas數據結構介紹
5.2基本功能
5.3匯總和計算描述統計
5.4處理缺失數據
6.Pandas數據加載和存儲
6.1讀寫結構化數據
6.2讀寫非結構化數據
6.3使用HTML和Web API
6.4使用數據庫
7.Pandas數據預處理
7.1合并數據集(以merge和append為主)
7.2重塑和軸向旋轉
7.3數據清洗
7.4字符串操作
8.Pandas數據聚合與分組運算 8.1GroupBy技術
8.2數據聚合
8.3分組運算和轉換
8.4透視表和交叉表
9.繪圖與可視化 9.1Matplotlib基本操作
9.2Pandas中的繪圖函數
10.時間序列
10.1日期和時間數據類型及工具
10.2 時間數據處理
10.3 時期及其算術運算
10.4 時間序列繪圖
10.5 移動窗口函數
11.Python在金融數據中的應用
11.1常見的金融數據處理與分析
11.2 Pyfolio資產組合表現與風險分析
11.3 Zipline歷史數據回溯分析
12.大數據平臺的搭建和應用
12.1Hadoop和MapReduce
12.2 Spark
12.3 PySpark及MLlib
12.4【案例與演示】
13.Scikit-Learn機器學習
13.1數據預處理
13.2 變量升維和降維
13.3 模型訓練
13.4模型選擇和調參
13.5 模型評估指標 |