🧠 科目二 心智圖 — 大數據處理分析與應用

L221 / L222 / L223 / L224 四大塊階層展開

科目二 大數據處理分析與應用(L22)

L221 機率統計基礎

L22101 敘述性統計與資料摘要技術

集中趨勢(三均數 + 眾數 + 中位數)

離散程度

分佈形狀

Z-score 標準化

pandas 速查


L22102 機率分佈與資料分佈模型

重要數值

函數類型

離散型分佈

連續型分佈

分佈擬合與資料建模


L22103 假設檢定與統計推論

統計推論兩大分支

假設檢定五步驟

兩種錯誤

平均數的差異檢定

比例檢定

類別變數

相關性

非參數檢定

多重比較


L222 大數據處理技術

L22201 數據收集與清理

5V 特性

資料來源

資料品質五類問題


L22202 數據儲存與管理

資料型態與儲存對應

NoSQL 類型

分散式儲存

三大資料架構

ACID 四特性

一致性策略

治理

權限模型

知識圖譜設計


L22203 數據處理技術與工具

處理框架

即時 / 串流

管線編排(ETL/ELT)

資料前處理


L223 大數據分析方法與工具

L22301 統計學在大數據中的應用

大數據統計挑戰

應對策略


L22302 常見的大數據分析方法

近似演算法(大數據三大代表)

時序分析

圖網路分析

文字分析

地理空間分析

異常偵測

關聯規則


L22303 數據可視化工具

數值型分佈呈現

多變數關聯

類別型呈現

設計原則(Edward Tufte)

工具分類


L224 大數據在 AI 之應用

L22401 大數據與機器學習

大數據 5V 對 ML 流程的影響

訓練效能加速

即時 ML

漂移偵測


L22402 大數據在鑑別式 AI 中的應用

任務情境

模型選用

標註策略


L22403 大數據在生成式 AI 中的應用

資料品質四要素

應用情境

偏誤類型


L22404 大數據隱私保護、安全與合規

個資識別

敏感度層級

PIA 隱私影響評估

PETs(隱私強化技術)

法規對照

合法依據

隱私技術組合(高頻考點)