SOC
2022 11.03
12/1 【AI x Future AI趨勢論壇】一眼看穿數據重點-資料視覺化與探索式統計分析

【AI x Future AI趨勢論壇】一眼看穿數據重點-資料視覺化與探索式統計分析

【主講人】中央研究院統計科學研究所 陳君厚所長

【講題】 一眼看穿數據重點-資料視覺化與探索式統計分析

【時間】 12/1 星期四 3:30-4:30PM

【地點】成大光復校區管理學院B1 62X05演講廳

【報名連結】120位名額,請於11月30日(含)前點此連結

如成大學生欲報名通識認證講座,請先寄信至yenyuchen@gs.ncku.edu.tw,待報名連結建好後會再通知您

 
統計學是有關資料(數據)蒐集、整理、分析、建模、推論、解釋、與呈現的科學。而資料視覺化(統計繪圖)在整個統計分析過程的各個階段都扮演了舉足輕重的角色。在前段,針對任何一份資料,資料分析者首先必須嘗試了解手上資料的整體結構,才能夠在後續進行分析、建模、與推論時選擇合適的程序,而了解資料的最重要方法就是視覺化(繪圖),藉由各種繪圖工具去「看」資料、探索資料結構;在中段,資料視覺化除了被動配合各種建模、推論工具以尋求最佳之資料分析過程,也可能用來主動發掘資料中未知訊息;在後段,資料視覺化用來呈現分析結果,將分析過程中所獲得之訊息傳達給資料使用者。
 
資料視覺化的工具千百種,如何選擇合適與正確的方式去探索資料是統計科學中一門重要的學問—探索式資料分析 (EDA: Exploratory Data Analysis)。EDA的作用在於從「看」資料獲得資料所傳達的訊息,所注重的是簡單的算術與容易建構的圖、表。透過EDA對於圖表中所顯露的型樣做一初步的認知與描述,再進一步以人類的心智(與建模、推論)對所接受的訊息做全面的分析與判斷,以探索潛藏於資料中的訊息;強調的是探索式的分析而非嚴謹的數學模式確認。

現代資料科學與統計分析面臨高維度與高複雜度之巨量資料 (BIG Data) 艱難挑戰,發展有效率之統計繪圖法與視覺化環境以幫助分析者在處理由先進科技與複雜實驗所產生之資料為統計學家重要職責。本演講將介紹相關研究團隊多年來發展之矩陣視覺化環境—廣義相關圖 (GAP: Generalized Association Plots)。我們以矩陣視覺化來進行統計分析,包含敘述統計、建模、推論,以至於診斷;我們也將統計概念引進矩陣視覺化環境以處理更複雜之資料形態。GAP可以處理上萬個樣本在上萬個維度(變數)的各式資料與關係矩陣,包含連續、二元、有序、類別、象徵性 (symbolic data)、及與地圖學連結之各類資料。本演講將經由各種實例介紹GAP與各種資料視覺化工作環境。
 
歡迎您先行操作GAP (連續、二元資料 continuous/binary data)、iGAP (象徵性資料 symbolic data)試用,請由 以下連結下載安裝 Java 版軟體:
 
(1) GAP: Download  
 
(2) iGAP: Download from Link5  
 
 
或者您可以於線上版測試 GAP 與 iGAP 環境: 
 
(1) 線上版 GAP  
 
(2) 線上版 iGAP