用Python玩轉數據

用Python玩轉數據

用Python玩轉數據課程是南京大學於2016年04月12日首次在中國大學MOOC開設的慕課課程、國家精品線上開放課程。該課程授課教師是張莉。據2021年1月中國大學MOOC官網顯示,該課程已開課10次。

用Python玩轉數據課程以Yahoo財經數據為基礎,通過構建一個個案例,可以讓大家以直觀的方式認識Python的功能。該課程主要介紹或項目使用到的Python第三方庫有:Requests,BeautifulSoup,re,NumPy,pandas,Matplotlib,sklearn,NLTK,Pillow繪圖庫,結巴分詞,WordCloud詞雲圖,Gensim等。

基本介紹

  • 中文名:用Python玩轉數據
  • 類別:慕課、國家精品線上開放課程
  • 授課老師:張莉
  • 提供院校:南京大學
  • 授課平台:中國大學MOOC
  • 開課時間:2016年04月12日(首次)
課程性質,課程定位,適應對象,開課信息,課程簡介,課程大綱,課前預備,預備知識,參考資料,授課目標,所獲榮譽,教師簡介,

課程性質

課程定位

用Python玩轉數據課程探討Python除了在商業領域之外在文學、社會學和新聞等人文社科類領域以及在數學和生物等理工類領域同樣擁有便捷高效的數據處理能力,並可以觸類旁通將其靈活套用於各專業中。

適應對象

用Python玩轉數據課程主要面向非計算機專業的軟體開發愛好者,不局限某個專業和學歷層次。

開課信息

開課次數
開課時間
授課教師
學時安排
參與人數
第1次開課
2016年04月12日~2016年06月21日
張莉
2-4小時每周
28918
第2次開課
2016年09月08日~2016年11月15日
34850
第3次開課
2017年05月12日~2017年07月22日
25478
第4次開課
2017年09月19日~2017年11月30日
2-5小時每周
29900
第5次開課
2018年03月12日~2018年05月25日
32494
第6次開課
2018年09月17日~2018年12月03日
2-4小時每周
51324
第7次開課
2019年03月12日~2019年05月28日
34202
第8次開課
2019年09月09日~2019年11月22日
29774
第9次開課
2020年02月17日~2020年05月21日
59575
第10次開課
2020年09月21日~2020年12月16日
21388
(註:表格內容參考資料

課程簡介

用Python玩轉數據課程分5個學習模組和1個項目實戰模組,從Python基本語法開始,到Python中如何從本地和網路上進行數據獲取,如何表示數據,再到如何對數據進行預處理,探索,分析與統計及可視化,到最後如何設計一個簡單的GUI界面來表示和處理數據,層層推進。

課程大綱

MODULE 01: Python基礎之第一周 走近Python
1.1 Python簡介
1.2 第一個Python程式
1.3 Python語法基礎
1.4 Python數據類型
1.5 Python基本運算
1.6 Python的函式、模組和包
補充視頻:Python環境搭建
第一周 走近Python單元測驗
MODULE 04: Python數據統計與挖掘之第五周 Python便捷數據獲取與預處理
5.1 便捷數據獲取
5.2 Python繪圖基礎
5.3 數據探索與預處理之數據清洗
5.4 數據預處理之數據變換
5.5 數據預處理之數據規約
拓展:財經數據接口TuShare研究和數據處理分析小項目
數據集獲取:數據預處理常用數據集titanic數據集獲取
第五周 Python基本數據統計單元測驗
MODULE 01:Python基礎之第二周 Python面面觀
2.1 條件
2.2 range函式
2.3 循環
2.4 循環中的break,continue和else
2.5 自定義函式
2.6 遞歸
2.7 變數作用域
拓展視頻1:Python常用標準庫函式
拓展視頻2:異常
第二周 控制結構和函式編程練習(8題)
第二周 Python面面觀單元測試
控制結構和函式編程題
MODULE 04:Python數據統計與挖掘之第六周 Python數據統計挖掘與套用
6.1 數據探索之基本數據特徵分析
6.2 基於pandas的數據統計與分析
6.3 聚類分析
6.4 Python的理工類套用
6.5 Python的人文社科類套用
第6周拓展視頻1:基於pandas的男女電影評分差異分析
第6周拓展視頻2:基於隨機森林模型的紅酒品質分析
第六周 Python數據統計挖掘與套用單元測驗
MODULE 02:數據獲取與表示之第三周 數據獲取與表示
3.1 本地數據獲取
3.2 網路數據獲取
3.3 序列
3.4 字元串
3.5 列表
3.6 元組
拓展視頻1:正則表達式簡介
拓展視頻2:輸入輸出&函式式編程入門
拓展視頻3:可變可疊代對象修改問題解釋
拓展視頻4:動態網頁數據爬取小例
進階:爬蟲小項目(3項)
補充資料:序列運算、操作、函式和方法簡介
第三周 數據獲取與表示基礎編程練習(3題)
第三周 數據獲取與表示單元測試
數據表示編程題
MODULE 05:面向對象和圖形用戶界面
7.1 GUI與面向對象
7.2 抽象
7.3 繼承
7.4 GUI的基本框架
7.5 GUI常用組件
7.6 布局管理
7.7 其他GUI庫
7.8 綜合套用
財經數據GUI編程項目
面向對象編程小練習
第七周 面向對象和圖形用戶界面單元測驗
MODULE 03:第四周 強大的數據結構和Python擴展庫
4.1 為什麼需要字典
4.2 字典的使用
4.3 集合
4.4 擴展庫SciPy
4.5 ndarray
4.6 變長字典Series
4.7 DataFrame
第4周拓展視頻1:字典和集合編程示例介紹
第4周拓展視頻2:NumPy常見套用選講
第四周 強大的數據結構和Python擴展庫單元測驗
字典相關編程題
第八周 項目實踐
項目實踐說明
參考項目1—線性回歸分析入門之波士頓房價預測
參考項目2—新浪動態新聞標題熱點挖掘
參考項目3—文檔相似性比較
第八周項目實踐提交
(註:表格內容參考資料

課前預備

預備知識

用Python玩轉數據課程需要一些程式設計的基本概念如計算機求解問題的框架和一些如素數判斷這樣的基本算法。

參考資料

書名
ISBN
作者
出版社
出版時間
《Python基礎教程》
978-7-115-23027-0
(挪)Magnus Lie Hetland著;司維,曾軍崴,譚穎華譯
人民郵電出版社
2010年
《Python核心編程》
978-7-115-17850-3
(美)Wesley J. Chun著;宋吉廣譯
人民郵電出版社
2008年
《利用Python進行數據分析》
978-7-111-43673-7
Wes McKinney著;唐學韜等譯
機械工業出版社
2014年
《 Python編程從入門到實踐》
978-7-115-42802-8
(美)Eric Matthes著;袁國忠譯
人民郵電出版社
2016年
《Python程式設計》
978-7-04-051242-7
張莉主編
高等教育出版社
2019年
(註:表格內容參考資料

授課目標

用Python玩轉數據課程授課目標為愛上Python,愛上數據分析,愛上用Python進行數據分析。

所獲榮譽

2019年1月8日,用Python玩轉數據課程被評為國家精品線上開放課程。

教師簡介

張莉,博士,南京大學計算機科學與技術系基礎教學部教師,主要研究領域為數據挖掘和自然語言處理,主持和參與多個國家科研基金項目和教育部教改項目。

相關詞條

熱門詞條

聯絡我們