• 課程大綱-1819S1-計算機視覺

    2018-08-23 20:55:41

    北京大學深圳研究生院

    Peking University Shenzhen Graduate School

    2018 -2019學年year1學期semester

    課程大綱Syllabus

    課程編號Course ID:            開課學期Course Time:1819S1         

    總學時Total hours:     48         學分Credit:3

    課程名稱Course Name: 計算機視覺

    英文名稱English Name:Computer Vision

    教學方式Teaching Style:課堂講授    

    考試方式Examination Method:考查

    先修要求Prerequisites: 無

    主講教師Lecturer:  張健               

    輔助教師Teaching Assistant:無

    學科領域Field of study:多媒體信息處理、人工智能、圖像處理

    大綱執筆人Syllabus author:張健

    制定年月Date :2018年4月

    成績評定方法Grading:

    課程作業占35% + 學生項目占30% + 口頭報告占35%

    大綱內容簡介(300漢字以內):

    Brief introduction of the syllabus(300 words at most):

    計算機視覺是一門關于如何運用照相機和計算機來獲取我們所需的,被拍攝對象的數據與信息的學問亚博电子游戏官网。形象地說,就是給計算機安裝上眼睛(照相機)和大腦(算法)亚博电子游戏官网,讓計算機能夠感知環境。目前計算機視覺已發展成為計算機科學領域最活躍方向之一亚博电子游戏官网,也是信息科學和人工智能的重要組成部分,是計算機科學與技術專業的重要核心課程之一亚博电子游戏官网。本課程為選修課程亚博电子游戏官网,其目的在于為學生建立計算機視覺的基本概念、基本理論和方法、相關技術和應用技術;培養學生有效地運用所學知識和方法解決實際問題的能力。

    大綱詳細內容(2000漢字以內):(請按開課單元撰寫,注明學時)

    Details of the syllabus(2000 words at most):(according to the units, state the class hours)

    1.  第一周 (3學時)

    內容:

    課程導論與課程計劃

    目的:

    課程整體介紹及安排,通過對計算機視覺的前沿介紹并以討論的方式找到每位同學的興趣點,初步確定每位同學本課程項目報告的研究內容。

    2.  第二周 (3學時)

    內容:

    圖像表示與濾波

    • 光與色彩空間
    • 圖像濾波
    • 頻域表示
    • 布置作業1:圖像濾波與合成等基本操作

    目的:

    介紹數字圖像的基本表示形式以及在空間和頻域上的濾波操作亚博电子游戏官网,讓學生熟悉在Matlab等平臺上進行相應的操作亚博电子游戏官网。

    3.  第三周 (3學時)

    內容:

    作業1講解與分析

    特征檢測與匹配

    • 邊緣檢測
    • 興趣點及角點檢測

    目的:

    了解傳統的圖像邊緣、興趣點及角點檢測的常用方法,熟悉各種檢測算子以及其相應的應用。

    4.  第四周 (3學時)

    內容:

    特征檢測與匹配

    • 局部圖像特征
    • 特征匹配

    布置作業2:局部圖像特征提取與匹配

    目的:

    了解經典的局部圖像特征與特征匹配的方法,動手實現各種方法并運用其進行圖像檢索與拼接等應用。

    5.  第五周 (3學時)

    內容:

    作業2講解與分析

    機器學習回顧

    • 有監督學習
    • 無監督學習

    目的:

    學會區分機器學習與計算機視覺的異同,熟悉機器學習中有監督與無監督兩類方法的特點,學會將其引申到計算機視覺當中并進一步擴展。

    6.  第六周 (3學時)

    內容:

    圖像識別

    • 識別綜述與詞袋
    • 大規模實例識別

    目的:

    掌握用于圖像或視頻檢索的詞袋技術(Bag of Features),能夠利用其對圖像或視頻進行比對。

    7.  第七周 (3學時)

    內容:

    圖像識別

    • 大規模場景識別及高級特征編碼
    • 滑動窗檢測技術

    布置作業3:利用詞袋技術進行場景檢測

    目的:

    掌握大規模數據下,利用視頻或者圖像中提取的特征進行快速有效的特定場景檢測。

    8.  第八周 (3學時)

    內容:

    作業3講解與分析

    深度學習

    • 神經網絡基本部件
    • 經典的神經網絡結構

    布置作業4:基于卷積神經網絡進行MNIST數據分類

    目的:

    掌握深度神經網絡的基本部件知識,學會用主流深度學習平臺Tensorflow或PyTorch等搭建數字分類亚博电子游戏官网亚博电子游戏官网、圖像分類等神經網絡。

    9.  第九周 (3學時)

    內容:

    作業4講解與分析

    深度學習

    • 神經網絡超參數設定與網絡訓練
    • 神經網絡正則化與壓縮

    布置作業5:基于稀疏正則化對參數進行壓縮

    目的:

    掌握利用梯度下降算法進行參數更新的原理,懂得深度神經網絡訓練及設定超參數的技巧,了解利用低秩近似、剪枝與稀疏約束、二值化等技術對神經網絡進行壓縮亚博电子游戏官网。

    10. 第十周 (3學時)

    內容:

    作業5講解與分析

    深度學習

    • 循環神經網絡
    • 優化算法驅動下的神經網絡設計

    布置作業6:利用循環神經網絡“寫詩”

    目的:

    掌握能夠描述數據之間長期依賴關系的循環神經網絡原理亚博电子游戏官网,學會搭建能夠自己“寫詩”的神經網絡亚博电子游戏官网,了解利用優化算法展開進行具有結構特性的前沿神經網絡設計的技術。

    11. 第十一周 (3學時)

    內容:

    作業6講解與分析

    多視點與運動分析

    • 成像與光學
    • 相機標定
    • 立體成像

    布置作業7:相機標定與基礎矩陣估計

    目的:

    掌握在圖像測量過程以及機器視覺應用中,為確定空間物體表面某點的三維幾何位置與其在圖像中對應點之間的相互關系,建立相機成像幾何模型的基本原理,能夠熟練地從世界坐標系變換到圖像坐標系。

    12. 第十二周 (3學時)

    內容:

    作業7講解與分析

    多視點與運動分析

    • 光流
    • 實時姿態估計

    目的:

    掌握圖像光流的計算方法,學會利用光流去進行實時的物體姿態估計。

    13. 第十三周 (3學時)

    內容:

    前沿論文研習及個人項目匯報(1)

    ·每位同學針對第一周選定的感興趣的計算機視覺內容,與老師確認后亚博电子游戏官网,選擇精讀2篇最新論文和泛讀6篇論文,并親自動手實現精讀算法,形成該研究內容的完整報告進行匯報。匯報時間20分鐘,答疑10分鐘亚博电子游戏官网。

    目的:

    一方面亚博电子游戏官网,讓學生針對感興趣的內容做一個項目亚博电子游戏官网,充分運用和消化所學知識;另一方面,培養和鍛煉學生的文獻閱讀、動手實踐以及科研能力,從而能夠在項目的基礎上亚博电子游戏官网,通過調研亚博电子游戏官网、討論、匯報和答疑等流程形成自己的認識與理解,提出自己的創新和想法。

    14. 第十四周 (3學時)

    內容:

    前沿論文研習及個人項目匯報(2)

    ·每位同學針對第一周選定的感興趣的計算機視覺內容亚博电子游戏官网,與老師確認后亚博电子游戏官网,選擇精讀2篇最新論文和泛讀6篇論文,并親自動手實現精讀算法,形成該研究內容的完整報告進行匯報。匯報時間20分鐘,答疑10分鐘。

    目的:

    一方面亚博电子游戏官网,讓學生針對感興趣的內容做一個項目,充分運用和消化所學知識;另一方面亚博电子游戏官网亚博电子游戏官网,培養和鍛煉學生的文獻閱讀亚博电子游戏官网、動手實踐以及科研能力,從而能夠在項目的基礎上,通過調研、討論、匯報和答疑等流程形成自己的認識與理解,提出自己的創新和想法亚博电子游戏官网。

    15. 第十五周 (3學時)

    內容:

    前沿論文研習及個人項目匯報(3)

    ·每位同學針對第一周選定的感興趣的計算機視覺內容,與老師確認后,選擇精讀2篇最新論文和泛讀6篇論文,并親自動手實現精讀算法亚博电子游戏官网,形成該研究內容的完整報告進行匯報亚博电子游戏官网。匯報時間20分鐘,答疑10分鐘亚博电子游戏官网。

    目的:

    一方面,讓學生針對感興趣的內容做一個項目,充分運用和消化所學知識;另一方面,培養和鍛煉學生的文獻閱讀、動手實踐以及科研能力,從而能夠在項目的基礎上,通過調研、討論亚博电子游戏官网、匯報和答疑等流程形成自己的認識與理解,提出自己的創新和想法。

    16. 第十六周 (3學時)

    內容:

    個人成果展示

    ·每位同學將自己最終完成的項目方案形成最終報告并以PPT的形式在課堂上匯報出來(每人10分鐘),專家(擬邀請幾位學院老師)和班級其他同學作為評委針對其工作量、創新性以及現場表現進行綜合打分。

    目的:

    鍛煉學生寫作能力亚博电子游戏官网亚博电子游戏官网、表達能力以及換位思考能力。

    教材Text book:無

    參考資料 Reading materials:

    1. Richard Szeliski. Computer Vision: Algorithms and Applications, Springer, 2010.

    2. Ian Goodfellow and Yoshua Bengio and Aaron Courville. Deep Learning, MIT Press, 2016.

    亚博电子游戏官网