👁️ 單元五:鑑別式 AI 的原理與應用
📌 什麼是鑑別式 AI?
鑑別式 AI(Discriminative AI)專注於分類與辨識,在類別之間畫出決策邊界。
- 重點:判斷「這是什麼?」
- 與生成式 AI 的差異:生成式 AI 創造新內容,鑑別式 AI 分析現有內容
📌 影像分類
CNN 卷積神經網路
- 卷積層:用濾波器/核心提取局部特徵(邊緣、紋理)
- 池化層:降低維度,保留重要特徵
- 全連接層:綜合特徵進行分類
Azure AI Vision 服務
- 基於 Florence 基礎模型的預建模型
- 功能:影像分析、物件偵測、文字辨識、智慧裁切、背景移除、內容審核
- 信心分數(例如:衝浪板 90.4%、人 95.5%)
📌 物件偵測 (Object Detection)
比影像分類更進階,不只辨識「是什麼」,還定位「在哪裡」。
- 輸出:物件類別 + 邊界框 (Bounding Box) + 信心分數
- 應用:自動駕駛、零售結帳、安防監控
📌 光學字元辨識 (OCR)
Azure AI Vision Read API
- 支援即時與批量文字擷取
- 處理不同行數與手寫文字
- 結果按頁→行→字組織
- Vision Studio 提供無程式碼使用方式
📌 文件智慧處理 (Document Intelligence)
預建模型支援: | 文件類型 | 擷取資訊 | |---------|---------| | 收據 | 日期、店名、品項、金額 | | 發票 | 供應商、明細、稅額、總額 | | 銀行對帳單 | 交易日期、金額、餘額 | | 身分證件 | 姓名、地址、證號、照片 |
📌 人臉偵測與分析
- 人臉偵測:定位圖像中的人臉(邊界框)
- 人臉分析:偵測屬性(眼鏡、口罩、頭部姿態、模糊度、曝光度)
- 人臉驗證:1:1 比對(這是不是同一個人?)
- 人臉辨識:1:N 比對(這個人是誰?)
- ⚠️ 隱私與倫理考量至關重要
📌 No Code / Low Code AI
定義
| 類型 | 對象 | 說明 |
|---|---|---|
| No Code | 非技術人員 | 視覺化拖拉,完全不需寫程式 |
| Low Code | 開發人員 | 視覺化 + 少量程式碼 |
與生成式 AI 結合
- 自動程式碼生成
- 模板設計
- 資料分析自動化
- 平台評估 6 要素:目標用戶、功能/擴展性、安全/合規、成本/ROI、技術支援、市場評價
💡 考試重點:鑑別式 vs 生成式 AI 的差異、CNN 三層結構、OCR 流程、No Code vs Low Code 定義