澳 門 科 技 大 學
應用數學與數據科學碩士學位課程
必修科目:
MIMZ01 數據科學中的數學方法(3 學分)
本課程將主要介紹數據科學中常用的數學方法,主要內容包括:凸優化的定義、概念,以及凸分析和一些結果,凸優化在概率統計、計算幾何以及數據擬合中的廣泛應用,求解凸優化問題的數值方法,包括牛頓法以及內點法。
MIMZ02 數值線性代數(3 學分)
本課程首先簡要回顧線性代數中的基礎概念和理論。在此基礎上將主要介紹數值計算中的常見問題, 如:問題的條件數及算法穩定性分析、高斯消去法及LU分解、 Gram-Schmidt正交法、最小二乘問題、特徵值問題、奇異值分解以及基本的迭代法等,並同步介紹相關算法的實現。
MIMZ03 數據科學開源工具(3 學分)
本課程將主要講授Python語言的基本語法以及控制結構,進而介紹數據分析中常用的模塊如:Numpy, Pandas, Mathplotlib, Sqlit3, Sklearn等的使用。最後介紹應用Python來進行常見的數據分析操作,如抓取網絡數據、正則表達式、存儲數據及訪問,迴歸與分類,聚類分析,PCA主成分分析,以及時間序列分析與預測等。此外,本課程也將涵蓋其他開源工具的使用,包括SQL語句、Shell編程、Julia程序語言、OpenCV等。
MIMZ04 應用統計分析(3 學分)
本課程將主要介紹數據科學中常用的概率統計模型和方法,如概率論的基礎理論,隨機事件的概率問題,數字特徵,統計量,離散型和連續型隨機變量的分佈模型,數據收集和分類,大數定理和中心極限定理,點估計和區間估計,常用假設檢驗法,回歸模型,方差分析,多元統計分析,貝葉斯統計等。
MIMZ05 數據挖掘(3 學分)
本課程介紹最新的數據挖掘技術及其應用。 本課程的宗旨是幫助學生瞭解數據挖掘技術的原則和重要性,主要關注數據挖掘的技術發展及其相關學科,如人工智能和機器學習。本課程的主題包括數據科學的概念和技術,如數據統計描述、數據可視化、數據預處理、數據倉庫、頻繁的模式挖掘和關聯規則分析、分類和監督學習、聚類和非監督學習、變量選擇。此外,通過 Python 實現相關算法也是必要的。
MIMZ06 機器學習(3 學分)
本課程將廣泛地介紹機器學習、數據挖掘、統計模式識別等內容。主題包括:(一)監督學習(參數/非參數算法,支持向量機,核函數,神經網絡)。(二)無監督學習(聚類,降維,推薦系統,深度學習推薦)。(三)在機器學習的最佳實踐。
MIMZ07 時間序列分析(3 學分)
本課程為學生全面介紹時間序列分析的基礎知識和分析實際數據的方法。課程將學習時間序列的分解、滑動平均、指數滑動平均等方法,以及相關係數、平穩性等基礎知識。另外,課程將介紹巴斯擴散模型、Holt-Winters 指數平滑模型、一般線性模型、Harmonic季節模型、隨機遊走、滑動平均過程、自回歸過程、自回歸條件異方差模型等傳統時間序列模型。課程中的模型都會用來擬合實際的數據,幫助對模型更好地理解和使用。將採用R語言來做圖和分析數據。這些內容有助於時間序列理論研究和解釋現實世界的數據。
選修科目:
MIME01 應用數學高級專題(3 學分)
本課程將主要介紹應用數學中的實用專題,例如數學物理反問題的计算方法。課程主要涵蓋截斷奇異值分解、Tikhonov正則化方法、變分正則化,以及統計反問題計算方法(馬爾可夫鏈蒙特卡洛採樣以及貝葉斯推斷)等一系列數學反問題常用方法。另外,課程也會介紹一些數學反問題的實際應用,包括CT、卷積與圖像去模糊應用等。
MIME02 數據科學高級專題(3 學分)
本課程介紹數據科學的最新理論和應用, 如深度學習及其在計算機視覺和自然語言處理中的應用。深度學習是機器學習的一個分支,它與現代神經網絡的發展和應用有關。深度學習算法以最大化給定任務的性能的方式提取數據分層高級表示形式。課程將涵蓋一系列主題,從基本神經網絡、卷積和循環網絡結構、深度無監督和強化學習,以及應用到自然語言處理和計算機視覺等領域。
MIME03 數據科學程序設計(3 學分)
本課程重點介紹基於深度學習的算法、模型以及編程實踐。課程採用PyTorch作為深度學習框架, 涵蓋NumPy、Pandas、機器學習理論、測試/訓練/驗證數據拆分、模型評估、張量、神經網絡理論(感知機、網絡、激活函數、成本/損失函數、反向傳播、梯度)、人工/深度神經網絡(ANN / DNN),卷積神經網絡(CNN),循環神經網絡(RNN,LSTM,GRU),自然語言處理以及PyTorch中使用GPU訓練等內容。
MIME04 數碼圖像處理 (3 學分)
本課程旨在介紹數碼圖像處理及模式識別的基本原理、方法及其應用。內容包括數碼圖像的預處理、特徵提取、分析;統計模式識別,結構模式識別及其在不同領域中的應用。學生應根據所學內容,選讀相關論文並給出相應報告。
MIME05 數據可視化與可視分析 (3 學分)
本課程將主要介紹數據分析處理中常用的可視化技術, 包含對不同特徵分佈的數據進行多緯度展示,學習常用的Python繪圖模塊如Matplotlib與Seaborn等。
MIME06 數據倉庫與數據挖掘 (3 學分)
本課程旨在介紹數據倉庫和數據挖掘的基本原理和技術,內容包括數據倉庫(Data Warehouse)和聯機分析(OLAP)技術,數據預處理技術(數據的清理、集成、轉換和歸約),數據挖掘技術(分類、預測、關聯和聚類),以及數據挖掘的應用和發展趨勢。
MIME07 隨機過程 (3 學分)
隨機過程主要研究隨時間變化的隨機現象。本科目從工程應用的角度講授隨機過程的基本理論及其應用。內容主要包括隨機過程的基本概念、泊松過程、更新過程、馬爾可夫鏈、排隊論等。本課程培養學生使用隨機過程理論對隨機現象進行建模分析的能力。
MIME08 多媒體信號與系統 (3 學分)
本科目將介紹多媒體信號的表達與處理技術, 包括各種表達多媒體信號的方法, 如: 時域, 頻域, 時-頻域及特徵域。這些表達都可用於多媒體信號的區分。亦會討論多媒體信號的濾波設計以及一些自適應的處理技術, 如隱藏Markov模型, 隨機場模型, 狀態空間模型等。
MIME09 數據庫系統 (3 學分)
本科目介紹有關數據庫設計、實現和管理的基本理論。希望學生們通過這門課程的學習能夠:正確理解有關數據庫設計的概念,並且可以按照數據庫設計的步驟來完成設計;利用現有的關係數據庫管理系統來實現相應的數據庫設計方案;對於已經建立好的數據庫進行管理和維護,實現資源共享,同時維護數據的一致性。并介紹空間數據庫的概念與原理。