What are the opening hours?

Monday 09:00 - 18:00 Tuesday 09:00 - 18:00 Wednesday 09:00 - 18:00 Thursday 09:00 - 18:00 Friday 09:00 - 18:00

立達軟體, 台北市信義區仁愛路四段520-1號7樓, Taipei (2026)

07/05/2026

別人花錢搶學的AI課，桃園人竟然免費就能上！

💡 學會用AI清洗數據、打造代理人、秒出行銷素材
🎨 從文宣製作到視覺提案，5堂課全面升級職場技能
🤖 不只懂AI，還會用AI實際產出工作成果

📅 課程時間
5/06 數據淨化術：品質優化與實戰清洗｜19:00–22:00（3小時）
5/12 打造你的AI代理人數位特種部隊｜19:00–22:00（3小時）
5/14 文宣快手技：優質型錄極速生成｜19:00–21:00（2小時）
5/21 品牌煉金術：行銷素材全能產出｜19:00–22:00（3小時）
5/28 提案瞬移術：視覺化商務溝通｜19:00–22:00（3小時）

「政府免費補助AI課，猶豫的人已經輸在起跑點了！」
🔗 立即報名（額滿截止）
https://forms.gle/9QpzXYEFAVr4eCFN8

[注意事項]
1. 桃園市轄內設籍、居住、工作者或替代役男優先報名
2. 完課並填寫問卷心得，有機會獲選5名佳作(有獎勵)

服務窗口：[email protected]｜☎️ 0800-458688 黃先生

[主辦單位]
桃園市政府就業職訓服務處 × 智慧產業學院

05/05/2026

台大人工智慧實作課程 AI影像辨識實作 (類神經網路影像辨識)

一、開場與課程脈絡

CNN 從 1998 年 LeNet（Yann LeCun）開始，至今約 28 年。2012 年 AlexNet 用兩張 GPU 在 ImageNet 競賽奪冠，世界從此進入算力競賽，深度學習自此爆發。本課程以業界實作觀點介紹 CNN 影像辨識，涵蓋 Dense、Convolution、Pooling、激活函數、發展史與四大應用：影像分類、物件偵測、語義分割、物件分割。

二、業界使用評論（講師心得）

VGG 是講師最愛，效果最好，過去多數案子都用它當主力。GoogLeNet 效果沒特別好，後來就沒再用。ResNet 用得少，講師偏好 VGG16。GAN 生成對抗網路現在較少用，多被大型模型取代。R-CNN 系列效果不太好。

U-Net 講師很常用，原版即很好用，U-Net++ 等變體也好用。FCN 效果較差，不喜歡用；Mask R-CNN 內含 FCN，分割效果都不好。

YOLO v1 到 v3 從 v3 開始爆紅，速度快效果好。YOLOv4 出現後整個影像辨識大爆發，台灣中研院資訊所有參與。SSD512 是講師過去最愛之一，效果優於早期 YOLO。MobileNet 小網路效果差。RetinaNet、PSPNet 用得很少，DeepLab 號稱醫療影像常用但講師沒用過。

EfficientNet 一點都不 efficient，網路很大但效果沒很好，跳過。CSPNet 是台灣之光，由中研院資訊所廖弘源所長與王建堯博士團隊提出，可大幅降低算力需求且精度不掉。HRNet 在工業檢測、農業田間有實用價值。

ViT 把影像切成 16x16 patch 做 embedding 後丟進 Transformer Encoder。DETR 是 CNN 加 Transformer 結合，Facebook 出品。YOLOv5 是 Ultralytics 把 v4 改寫成 Python 版，採雙授權（GPL 或付費），但現在 AI 半小時就能改寫變數命名與架構，雙授權實際意義已變低。

ConvNeXt 看似厲害，講師沒用過。Stable Diffusion 過去很紅，現在多被大型模型如 GPT-Image-2 取代。YOLOv7 是講師目前主力（非雙授權，且有 C++ 程式），人流系統、瑕疵檢測都用，效果好速度快。SAM 與 SAM 2 是影像切割目前最強的，SAM 2 為兩年前發表。RT-DETR 屬 Transformer 即時偵測。YOLOv26 是 Ultralytics 最新，雙授權，講師不喜歡用。YOLOv11 到 v14 多由 Ultralytics 出品，其他團隊也借 YOLO 名字發論文。

小故事：YOLOv1 到 v3 原作者 Joseph Redmon 認為這項技術會毀滅人類，於 v3 後退出。後由 Alexey 接手，與台灣中研院廖所長、王博士合作做出 v4，台灣參與了 v4、v7、v9 三代。
三、Dense 全連接層

公式：y = h(W·x + b)。每個神經元接收上一層所有訊號，乘以權重後加總、加偏置、再代入激活函數。學者普遍認為人腦不是這樣運作，但目前還沒有更好的模型，所以大家沿用。

Dense 不適合處理影像：224x224x3 影像直接展平接 1024 Dense 約需 1.5 億參數，但 3x3 卷積核只需約 864 參數，且保留空間結構。Dense 完全忽略影像的局部相關與平移近不變先驗，因此影像處理通常前面要加 Convolution Filter。

四、Convolution 卷積

卷積運算以 3x3 Sobel 系列濾波器這種滑動視窗逐區計算加權總和，產生 feature map。Stride 是滑動視窗一次移動的距離（如 stride=2 表示每次跳 2 格），Padding 在邊緣補零保持輸出大小。

多通道與權重共享：RGB 影像卷積核需 3x3x3，K 個核產生 K 個 feature map。同一個核掃過全圖，大幅減少參數，並具備平移近不變性。

感受野方面，多層小核堆疊優於單層大核：兩層 3x3 約等於一層 5x5（參數 18 比 25），三層 3x3 約等於一層 7x7（27 比 49）。

五、Pooling 池化

Max Pooling 取最大值，Average Pooling 取平均，其他還有 L2 Pool、Strided Conv、SPP。現代 CNN 兩大趨勢：第一，GAP 對每個 feature map 取全圖平均，大幅減參、降低過擬合，ResNet、MobileNet 採用；第二，Strided Conv 用 stride=2 同時做特徵提取與降維，YOLO 與現代偵測器愛用。

六、深度學習框架演進

從 Caffe 開始，CNN 演算法逐步標準化（convolution、pooling、flatten、dense、softmax 等）。Caffe 研發人員後來加入 Facebook 的 PyTorch 陣營，部分研究者也曾在阿里巴巴服務。目前框架建議學 PyTorch 為主，TensorFlow 目前只有 Google 在維護。

七、激活函數

若激活函數為線性，多層網路等於單層線性。加入非線性後，多層 MLP 才能逼近任意連續函數（通用近似定理）。早期用 Sigmoid、Tanh 容易飽和梯度消失，現代主流為 ReLU 家族。講師補充：他用最好的是 hyperbolic tangent。最新的 GELU、Swish 用於 Transformer 與 LLM。

ReLU 家族成員：ReLU 即 max(0, x)；Leaky ReLU 避免死神經元；ELU 與 SELU 負區為指數曲線；GELU 為 BERT、GPT、ViT 主流；Swish 與 SiLU 為 EfficientNet、Swin 採用；Softmax 用於輸出層做多類機率分佈。重點：選激活函數要找非線性，線性效果不好。

八、CNN 演進歷史簡表

引爆點 AlexNet（2012）將 ImageNet Top-5 錯誤率從 26% 拉到 15.3%，約 6000 萬參數，首次用 GPU 加速，引入 ReLU、Dropout、資料擴增。LeNet-5（1998）當時用於手寫數字辨識，例如 MNIST 與銀行支票。

主要里程碑：1998 LeNet-5、2012 AlexNet、2014 VGG16/GoogLeNet/GAN、2014-15 R-CNN 家族、2015 ResNet/U-Net/FCN/YOLO v1、2016 SSD/DenseNet、2017 MobileNet/Mask R-CNN/RetinaNet/PSPNet、2018 DeepLab v3+、2019 CSPNet/EfficientNet/HRNet、2020 YOLOv4/ViT/DETR/Diffusion/YOLOv5、2021 Swin Transformer、2022 ConvNeXt/Stable Diffusion/YOLOv7、2023 SAM/YOLOv8/RT-DETR、2024 SAM 2/LLM 多模態（GPT、Gemini、Claude、Llama）/YOLOv9/YOLOv10、2025 RF-DETR/YOLOv12、2026 YOLOv26。

多模態時代（2024 之後）的 Transformer 輸入輸出不只是文字，還可以包含影像、聲音。目前影像分析、影像生成大多走多模態路線，例如 GPT 的 image generation 直接用 LLM 完成。

九、影像辨識四大應用

9.1 影像分類：輸入一張影像，輸出單一類別，例如蝴蝶蘭、文心蘭等花卉。指標包括 Top-1 與 Top-5 Accuracy、Precision、Recall、F1、ROC-AUC、Cohen κ、Confusion Matrix。遷移學習指在 ImageNet 預訓練後用自家資料微調，講師補充：遷移學習其實就是 resume，預訓練完之後接續訓練，可選擇凍結前段、訓練後段，或全部微調。

9.2 物件偵測：找出影像中物件的位置與類別，例如草莓在哪裡，讓機器手臂去抓。兩種主流：兩階段如 R-CNN 家族、Mask R-CNN，準確率高、較慢；單階段如 SSD、YOLO 系列、RetinaNet、EfficientDet、DETR、RT-DETR、RF-DETR，速度快、適合即時。指標：IoU 大於 0.5 視為 True Positive，mAP 是 PR 曲線下面積對所有類別平均，COCO 採 IoU 0.5 到 0.95 取平均。即時應用看 [email protected] 加 FPS，高精度看 [email protected]:.95。

9.3 語義分割：每個像素貼一個標籤，例如 CT 中標出肝臟、胃在哪。經典模型有 FCN、U-Net、PSPNet、DeepLab v3+、HRNet；Transformer 時代有 SegFormer、Mask2Former、SAM、SAM 2。指標包括 mIoU、Pixel Accuracy、Dice。

9.4 物件分割：先做物件偵測，再對每個獨立實例做分割，例如兩隻動物會被分成 1 號、2 號。經典 Mask R-CNN、YOLACT、SOLO，FCN 切割效果通常不好；現代有 Mask2Former、OneFormer、YOLOv8/v26 內建 segmentation、RF-DETR。目前主流為 SAM 2。
十、業界實務建議

影像分類用 VGG16，新案可考慮 Swin Transformer。物件偵測一般用 YOLOv7（非雙授權、效果好、速度快）；過去案子用 SSD512；最新研究用 RF-DETR，下載 GitHub 後請 AI 工具協助執行。語義或物件分割以 U-Net 為主，最新可用 SAM 2。生成用大型多模態模型取代 Stable Diffusion。較難案例搭配 Gemma、Google Gemini、Meta Llama 進一步分析。

講師也分享 AI 加速開發的觀察：現在用 AI 工具改寫程式碼非常快，半小時內就能把 YOLO 變數命名、程式架構整個改寫完畢；下載開源專案後叫 AI 協助執行 train.sh、inference.sh 等腳本，過去要自己改半天的工作 15 分鐘內就能完成。

十一、課後預告

下週實作：影像分類、物件偵測、語意分割、物件分割。

05/05/2026

台大人工智慧實作課程 AI影像辨識實作 (Digital Image Processing)

數位影像處理上課筆記

教材：Gonzalez & Woods《數位影像處理》第 4 版

【業界觀念】傳統演算法可解則優先採用（算力低、可解釋）；不可行再用 AI。

第 1 章緒論
- 影像數學定義：灰階 f(x,y)、彩色 f(x,y,c)；多光譜 RGB+NIR、高光譜可達上千通道。
- 三層概念：影像處理（影像→影像）、影像分析（影像→屬性）、電腦視覺（模擬認知決策，AI 分支）。
- 處理層級：低（去雜訊）、中（特徵）、高（認知）。
- 起源：報紙跨海傳輸、太空計畫、醫學影像（CT 為多 X 光重建切片）。
- 電磁頻譜應用：可見光 400–700 nm；NIR 400–2300 nm（葉綠素、氮肥、糖度）；UV／EUV（補牙、光刻機）；Gamma 為高頻電磁波；MRI（液態氦超導磁場）；超音波；電子顯微鏡（TEM／SEM，可見原子）。
- 系統流程：擷取→增強→復原→分割→特徵→分類→知識庫。

第 2 章數位影像基礎
- 人眼類比：水晶體＝鏡頭、虹膜＝光圈、視網膜＝感光元件；盲點為演化遺留；視錐細胞約 6–7M 集中於中央窩。
- 解析度：HD≈2M、4K≈8M 已超過視錐細胞；個體差異大。
- Mach Band：相同灰階受鄰域對比影響。
- 取樣（空間離散化）+ 量化（亮度離散化）；常見 8 bit 256 階；4 bit 出現假輪廓。
- 印刷 300 DPI、螢幕 72 DPI。
- 內插：最近鄰（保留原色，預設）、雙線性、雙三次（效果好但較重）。
- 連通：4 相鄰、8 相鄰（首選）、m 相鄰。
- 距離：歐氏距離（Embedding／ArcFace 常用）、City Block、Chessboard。
- 校正：標準色板做亮度與空間校正。
- 變換：旋轉／平移／縮放多用 OpenCV；高頻固定倍率縮放可寫組合語言加速。
- 影像配準（Registration）：機器手臂校正歪斜物。

第 3 章亮度轉換與空間濾波
- g = T(f)；亮度變換：負片、對數、Gamma（Photoshop 常用）。
- 應用：乳房 X 光攝影偵測纖維化硬塊（分十級）。
- 對比拉伸／灰階切片＋二值化（前景分離）。
- 位元切片：高位元為主結構，低位元寫浮水印不易察覺。
- 直方圖：拉伸、均化（Equalization）、匹配。
- 空間濾波：平滑（Low-pass）、銳化、邊緣偵測。
- 業界難題：刮痕／劃痕強化（含長度量測），講師公司核心 know-how。
- 中值濾波對抗椒鹽雜訊；Sobel 為最常用邊緣 filter；Laplacian 銳化；低／高／帶阻；通常需多濾波組合。

第 4 章頻率域處理
- 工具：DFT／FFT（傅立葉）；觀察主頻＋次頻。
- 案例：煉油廠以頻譜判斷馬達是否將損壞。
- CNN 概念：Sobel／Laplacian／Gaussian 都是 filter，將其權重交由倒傳遞學習＝convolution。
- 規則頻率雜訊：轉頻率域→塗黑亮點→反轉回空間域，雜訊消失。

第 5 章影像復原與重建
- 椒鹽雜訊也可頻率域去除；自適應濾波器實務少用。
- 工廠／田間 sensor 良好，較少復原；遙測、太空影像才常用。

第 6 章彩色影像
- 加色法 RGB（螢幕）；減色法 CMYK（印刷，K 補純黑）。
- 色彩空間：RGB／CMYK／HSI／LAB／XYZ／NDVI（遙測，加 NIR）。
- HSI／LAB 用於迴歸分析；CIE 色度圖。
- 偽彩色亮度切片：如溫度 0–20°C 由藍至紅。
- 色彩切片應用：採草莓鎖定紅色區。
- 色彩補色（通道反向）；色調校正常用。
- JPEG／色彩分割多用既有套件。

第 7 章小波（Wavelet）
- 曾紅極一時，現實用性下降；案例：洋香瓜紋理推甜度、地質油探。

第 8 章影像壓縮與浮水印
- 浮水印寫低位元平面，肉眼不察。
- 壓縮：Huffman、變長編碼、字典查表（類 Zip）。
- 自行實作少，多直接呼叫套件。

第 9 章形態學
- 侵蝕、膨脹（OpenCV 直接用）；Opening＝先侵後膨（去突出）；Closing＝先膨後侵（補凹洞）。
- 連通元件（八／四相鄰）、邊界擷取、孔洞填補。
- 細化／粗化（骨架）：印字、刮痕長度。
- 灰階形態學、Open/Close、侵蝕膨脹皆實務常用。

第 10 章影像分割
- 邊緣偵測：Sobel（首選）、Canny、Laplacian（指紋）。
- Hough Transform：刮傷／刮痕。
- 二值化：固定門檻、Otsu 自動門檻、多重門檻、區域性門檻。
- 區域成長（Region Growing）以八相鄰擴張；講師葉片研究即此概念，後人稱為語意分割（Semantic Segmentation）。
- 超像素／圖分割／分水嶺：少用。
- 現代主流：U-Net、Instance Segmentation（YOLO 系列）。

第 11 章特徵擷取
- 面積最常用（葉子、IC 邊緣崩缺）。
- 特徵須 robust（光照不變）。
- 紋理：香瓜糖度。
- Harris 角點：自走車導航、立體視覺比對。
- SIFT：影像比對。
- 邊界追蹤、簡化邊界、PCA、主成分影像：實務少用。
- 趨勢：傳統工具逐步被深度／變形網路取代。

第 12 章影像樣式分類
- Pipeline：預處理→特徵擷取→分類→標籤。
- 距離分類器：歐氏距離、最小距離；模板比對；結構比對（二元樹）；貝氏分類器。
- 啟動函數：Sigmoid（無負值，較弱）；Tanh（輸出 [-1,1]，講師長期首選）；ReLU（GPU 友善但非線性問題弱）。
- 多層感知機：兩層 10 神經元為早期常用；三層提升有限但訓練久。

05/05/2026

台大人工智慧實作課程人工智慧新聞 20260505

課堂筆記

一、紅杉資本（Sequoia Capital）：AI 是放大個人能力的槓桿

紅杉資本是美國知名投資公司，他們有一支影片講得非常好，主題是「AI 是槓桿，能放大自己的能力」。

我用 Google 的 NotebookLM 把影片轉成逐字稿，再透過 Claude 修正錯字與標點符號，整理成可閱讀的文稿。

核心觀點：
現在 AI 時代改變了很多事，最近股市大漲也是因為 AI。很多原本需要付費的工作正在被 AI 取代，例如軟體工程師。工程師現在主要負責「下指令、看結果、測試」，程式碼大部分由 AI 撰寫。一個工程師的能力等於放大 10 倍，相當於以前的 10 個工程師。軟體公司人力需求大幅下降，但對「厲害工程師」的需求反而提高。因為「乘以 10 倍」的效果，本身能力強的人會變得超強，初學者乘以 10 倍效果有限。結論：中等以下的專業人員容易被 AI 取代，頂尖的工程師、醫生、會計師仍無可取代。

二、本週技術新聞

MLX 框架
MLX 是 Apple 為 Mac 推出的專屬深度學習框架，速度看起來很快，但可能是「犧牲精度換速度」，需要實測幻覺情形。之前有客戶用標榜跑很快的框架做應用，幻覺問題嚴重，最後無法採用。

大陸四足仿生機器人
現在已經做到防水、防塵，能上山下海，在這個領域大陸做得非常好。

GPT Image 2
強烈推薦各位試用，做海報、繁體中文都非常精準。

我昨天用它幫一場 800 多人的線上演講做封面圖。第一次咒語：「請畫一個工程師透過槓桿翹起軟體的 bug」。第二次咒語：「請加上用了 Claude AI 可以放大十倍個人能力」。它就自動把背景文字（思考、計劃、寫程式、測試、Ship High Quality Code、Build、Improve、Repeat）都畫上去，整張海報不到 10 分鐘完成。也可以把公司名或實驗室名稱放上去。

為什麼這麼厲害？參數量至少 400B，頂尖模型甚至到 1600B。人腦大約 100B，1600B 約等於 16 個人腦的容量。採用 MoE（Mixture of Experts，混合專家模型）架構，一次只啟動少部分專家來回答問題（例如 16 個專家中啟動 2 個）。這是模仿人腦：做特定問題時只啟動特定區域，不是整個腦袋都運算。速度快、效率高。

Anthropic 的紅線
Anthropic 拒絕兩件事：第一，拒絕用 Claude 監控美國人民。第二，拒絕將 Claude 用於「無人類決策」的國防武器（不需人類同意就能殺人的機器）。結果被美國政府列入黑名單。但 Anthropic 靠 Claude API、Claude Enterprise 等民間業務已經賺得盆滿缽滿，國防部的錢只是小部分，所以這條紅線守得住。Google 也有部分工程師因為公司涉入軍事領域而選擇離職。

Enzo Tseng（無毒農創辦人）
原本是「好書服文創」創辦人，現在做「無毒農」。他積極導入 AI 到公司業務中（例如 LINE 客服），除了寫程式厲害，商業邏輯也很強，值得追蹤。

三、Claude 4.8 與 AI 加速教材製作

最近我做投影片都靠 AI。

範例一：影像處理聖經（教科書）。抓網路上的 PDF，用 Claude Code 一次生成一個章節，自動把英文 PDF 轉成中文投影片，連截圖都是 AI 處理。12 個章節 × 10 分鐘 ≈ 120 分鐘。排版錯誤再用 Claude for PowerPoint 修正。整本書的投影片只花 2~3 小時。

範例二：類神經網路影像辨識教材。從 1998 年的 LeNet（最早做銀行支票簽名比對），一路到最新的 YOLO v26。把業界常用的網路完整介紹，配圖、排版全部 AI 處理。一個晚上做出兩份投影片，一份 60 多張、一份 100 多張。

重點是「給 AI 一個 idea」，告訴它要呈現什麼。AI 是大殺器，可以節省 10 倍以上時間，做得又快又好。

四、Agent Workflow 與 AI 加速 AI 開發

Claude Code、Claude Sonnet（中階模型）、Claude Opus（最聰明）。寫複雜工作（如投影片）建議用 Opus。Anthropic 內部 75% 以上的程式由 AI 撰寫。我自己公司目前 95% 以上由 AI 撰寫。

類比編譯器的演進：早期只能寫很簡單的編譯器，後來用編譯器製造編譯器，一代一代疊代。現在 GCC、Visual Studio、Intel Compiler 都非常成熟。AI 也是一樣，會自我加速開發。

目前是非常特別的時間點，自從 ChatGPT 出來之後所有事情都加速了，台股漲翻天也是因為 AI 需求暴增。

五、其他新聞

心跳偵測 Sensor
能偵測心跳的電磁波變化，但有點匪夷所思，需要驗證。

OpenAI Agent / Codex CLI
我有試過 Claude Code、OpenAI Codex，目前 Claude 用起來最聽得懂人話、回答最人性化。

Google Gemini
除了 Antigravity 之外，還有 CLI Interface，各家都有。Claude 在 Linux 也有 CLI 介面，但 console 介面用起來不夠順，我目前是在 Windows 上用 GUI 視窗，再透過 NAS 同步檔案到 Linux。

NVIDIA 全球銷量排行
美國第一。新加坡第二（很多是大陸去投資的資料中心，或從新加坡轉運到大陸）。台灣也有不少轉運到大陸。馬來西亞也有類似情況。之前有人在抖音大喇喇秀廠牌就被抓了。美國禁止 AI 高階硬體輸出到大陸。

Claude 流量問題
昨天晚上 9 點多 Claude 突然壞掉，因為美國端流量太大暫停服務，休息一小時後恢復。

六、用 AI 改造專案

我公司有一個專案，原本約 20 萬行 PHP，用 AI 改寫成 Python 後變成 10 萬行，還加上資安防護，幾千個檔案大約兩週完成。以前可能要 3 個工程師做一年。

七、其他有趣議題

圖片壓縮上下文
有人提出用「圖片」方式壓縮 LLM 上下文，但記憶會變模糊。類比：有些人讀書是「拍照式」記憶，把書當影像存進腦子，瞬間記很多東西，考試很有用，但考完就忘。真正消化知識還是要 token 化（文字化）。睡眠時大腦可能在做訓練（做夢），所以讀書時睡眠不足，長期記憶無法形成。

CTO 重回寫程式
現在很多 CTO 又開始專注寫程式，因為寫程式變成一種享受。（我每天都弄到兩三點，現在寫程式很像打電動，看 token 用量百分比，不甘心沒用完就撐著，AI 跑的時候可以休息 5 到 10 分鐘）

電池技術
三元鋰電池：能量密度高，較貴。磷酸鋰鐵電池：成本低，大陸電動車（電驢）常用。

AI 很喜歡哥布林（Goblin）
不知道為什麼 GPT 訓練資料裡好像很多哥布林相關內容，要用 system prompt 去壓制。每個 AI（OpenAI、Claude）都有自己的 system prompt，常被反組譯出來研究。

資料庫被清空慘案
我有遇到下錯指令、或下到模糊指令，AI 直接把資料庫清空，超嚇人。重要建議：動資料庫前一定要先備份。用 Claude Code、OpenAI Codex 等工具建議在獨立電腦上執行。全線開放權限要謹慎。注意 rm -rf 手滑提早送出的風險。

Neuralink
馬斯克投資的腦機介面公司，植入微小探針到大腦，透過藍牙傳輸，可控制機械手臂、讓視障者看到模糊影像。

達克效應（Dunning-Kruger Effect）
從無知到專家會經歷的階段：無知時自信程度最高（高估自己）。經過社會打擊後跌入「絕望之谷」。經驗累積後自信慢慢上升。公司發展曲線也有類似效應：前期過熱 → 冷卻 → 緩步上升。

Suno 與華納音樂和解
拿一筆錢給華納，華納就讓 Suno 訓練，本質上就是為了錢，這也沒辦法，開公司就是為了賺錢。

Sponge Pong 乒乓球機器人
上週有提到。

課堂安排

休息到 10:10，回來後會講：第一，數位影像處理：什麼是數位影像。第二，類神經網路影像辨識：來龍去脈快速過一遍。如果時間不夠，實作部分挪到下週，今天先把基本觀念講清楚。

04/05/2026

感謝國立臺北科技大學訂購配備四張 NVIDIA RTX-PRO6000-96G 的人工智慧伺服器。😄

電腦線上估價：人工智慧 GPU 、桌機、工作站、伺服器，價格優惠透明。領先業界，採用精選高品質零件，出廠前皆經過 AI 燒機測試，確保穩定性。立達軟體科技曾參加國際AI大賽獲得第一名美金10萬元，資本額兩億，股票代碼.....

02/05/2026

台大人工智慧實作課程 AI大數據分析實作（分類、迴歸、時間序列、股票預測、金融指數預測）

單元一：AI 輔助學習與自媒體經營
新世代學習工具：可利用 NotebookLM 等 AI 工具建立筆記本，將教學影片輸入後，自動生成課程摘要與逐字稿，甚至可請 AI 幫忙產出測驗題目與簡報，提升學習效率。
自媒體推廣觀念：目前影音平台演算法對專業性質內容的觸及率較低（相較於生活化或娛樂性爆款內容）。若要增加專業影片的曝光度，可以考慮使用 Google Ads 等推廣（Promotion）功能。

單元二：大數據分析基礎與分類模型 (Classification)
利用大數據分析軟體（如 MAS Studio）可進行三大類分析：分類、迴歸與時間序列。
分類模型概念：預測結果為「有或沒有 / 是或否」。例如預測鐵達尼號乘客在船難中是生存（1）或死亡（0）。
核心演算法：
XGBoost：最為通用的演算法，擬合效果好，對於大小數據皆適用，是進行分類或股票分析的首選。
LGBM 與 Gradient Boosting：較適用於一萬筆以上的大量資料。
程式開發：現代分析不一定需要手刻程式，可直接請 Claude、Gemini 或 Codex 等 AI 工具協助撰寫 XGBoost 分析程式。
模型評估與 SHAP 分析：
訓練集正確率通常極高（如 98.75%），推論預測正確率大約在 70% 以上。
透過 SHAP 分析 (Feature Importance) 可以找出影響結果的關鍵特徵。以鐵達尼號為例，影響生死的關鍵為「性別」與「艙等」，若是頭等艙女性，生存率幾乎可達 86% 保證存活。
異常值 (Outlier) 處理：當訓練組預測出錯時，可能是儀器輸入錯誤或偏差，大部分情況應將其剔除；但也需確認是否為真實存在的特殊物理現象，以免刪除具價值的關鍵數據。
產業應用：多光譜分析可利用 XGBoost 篩選出 4 個關鍵波長，用於預測葉片氮肥、水分或水果糖度；結合雲端模型，更能發展出農用感測器的訂閱制商業模式。

單元三：迴歸模型實作 (Regression)
迴歸模型概念：用於預測「具體數值」，例如房屋價格、溫室環境控制參數或雞蛋產量預測。
演算法測試：通常會使用基礎的 Sine（正弦波）或 XOR 來測試演算法的擬合能力。多重線性迴歸無法良好擬合非線性的 Sine 波，而類神經網路 (DNN)、多項式迴歸與 XGBoost 則表現優異。
資料分析標準作業流程 (SOP)：
1. 定義 X 與 Y：明確定義輸入特徵 (X) 與要預測的結果 (Y)。如果 Y 有多個變數（如同時預測溫室的水牆、風扇是否開啟），建議拆分成多個獨立模型分別預測，效果會較準確。
2. 建立模型 (找 f(x))：導入演算法進行訓練與推論。應用案例（波士頓房價預測）：透過 SHAP 分析可得知，影響房價的主因包含低收入戶比例 (LSTAT)、房間數 (RM) 以及通勤距離與犯罪率等。模型評估：可以觀察「殘差圖」，資料點越集中於中間斜線，代表模型預測能力越好。

單元四：時間序列與記憶模型原理 (Time Series)
記憶模型 (Memory Model) 原理：現今的 AI 模型（包含 LSTM、Transformer）大多屬於記憶型模型，依賴「回想 (Record)」過去看過的資料空間來進行推論。如果預測資料落在過去訓練過的資料平面內，預測就會準確；反之，若無相關記憶則會失準。
時間序列特性：輸入的資料 (X) 具有時間先後順序關聯。
應用案例（航空銷售預測）：使用過去 12 個月的乘客人數作為「移動窗口」，預測下個月的人數。透過 SHAP 分析可解釋，影響下個月銷售量最大的是「去年同期」（航空業的淡旺季週期性）及「上個月」的銷售成績。

單元五：股票與金融指數預測
資料前處理的核心觀念：因為 AI 是記憶模型，絕對不能直接用「股價」去訓練。如果未來股價飆升超出歷史高點（例如超出訓練空間），模型就會失準。必須將價格轉換為「漲跌幅」或「相對指標（如 KD 線）」，確保訓練資料與預測資料落在同一資料空間內，模型才會穩健 (Robust)。
台積電股價預測實作：
設定 12 天的移動窗口，每天輸入 5 個參數（開盤、最高、最低、收盤、成交量），共 60 筆資料來預測隔日股價漲跌。
SHAP 解析：模型分析顯示，台積電隔日的股價與「前一天的盤中最低價、收盤價、開盤價」高度相關，但與「成交量」關聯較小。這印證了市場散戶常看前一天新聞決定隔天買賣的習慣。剔除不相關的雜訊，模型表現會更佳。

單元六：量化交易實務與 Python 程式自動化
股票交易的三種心態：
1. 先知先覺（內線消息）：擁有未公開資訊，獲利最高。
2. 後知後覺（量化與高頻交易）：利用 AI 監測籌碼或新聞，透過比散戶更快的「手速」賺錢。
3. 不知不覺（韭菜散戶）：不看新聞與盤勢盲目買賣。量化交易策略觀念： AI 預測通常「當天」或「隔日」最為準確，因此實務上多以當沖或隔日沖為主。夏普值 (Sharpe Ratio)：評估策略好壞的指標，即每承擔 1% 風險能獲利多少 %。數值大於等於 1 算是不錯的策略，小於 1 則代表承擔的風險不值得。最大回撤：評估在最糟情況下，資金會虧損多少百分比。 Python 自動看盤程式實作：資料擷取：由於許多網站具有反爬蟲機制，可使用 ZEN 等爬蟲軟體抓取 Google 新聞或證券交易所的即時上下五檔與收盤資料。綜合策略決策 (多數決模型)：
4. 委買委賣壓分析：為了防止假單干擾，建議「剃除極端值」（最高與最低的假單），僅觀察上下三到四檔，會讓模型更穩健。
5. 新聞情緒分析：運用大語言模型判斷即時新聞對該公司的情緒偏向正面或負面。
6. 技術與動能指標：結合黃金與死亡交叉與現價動能。程式每隔 1 到 2 分鐘自動運行上述策略，透過「多數決」（例如三項策略中有兩項顯示買進）產生最終的買賣訊號，可自行開發介面打造專屬自動看盤工具。

01/05/2026

台大人工智慧實作課程人工智慧新聞 20260428

模組一：硬體建置與設備選擇指南

1. 顯示卡(GPU)採購與電源安全高階顯示卡電源線風險：600瓦的高階顯示卡（如5090或Pro6000）容易發生電源線燒毀的問題。華碩針對此問題設計了異色接頭，若接頭露出不同顏色即代表未插緊，以避免因接觸面積過小導致電阻變大、發熱融毀。首選設備與規格：目前AI購機首選為具備96GB記憶體的NVIDIA Pro6000。瓦數選擇：強烈建議選擇 300瓦版本而非600瓦版本。300瓦不僅發熱較少、運作更穩定，且同一個機箱可擴充插滿四張卡（600瓦受限於體積只能插兩張）。雖然兩者效能差距約14%，但300瓦整體實用性更高。缺貨替代方案：近期5090持續缺貨，可考慮價格相近且同屬專業卡的Pro4500（32GB記憶體）作為替代品。

2. 跨平台測試策略 (Cost Reduction) 若欲使用AMD或Apple設備來節省硬體成本，切勿一開始就在這些平台上開發。正確流程：先在NVIDIA環境建立「黃金標準 (Golden Sample)」，確認模型運作正常、回答效果佳之後，再將系統移植到AMD或Apple設備上進行比對。這能避免在系統不穩時，誤將硬體產生的落差當作是AI模型本身的「幻覺」問題。

模組二：模型量化格式與推論引擎

1. 模型量化格式解析 GGUF：基於Llama.cpp開發的量化格式，Hugging Face上常見的Unsloth等公司會用此格式來宣傳新模型。除非電腦記憶體真的極少，否則不建議使用GGUF壓縮，因為量化會造成模型智商降低與能力減損。原生四位元格式 (如MXFP4)：若模型在訓練初期即採用四位元訓練（例如將近一年前的GPT-4 120B），則能兼顧節省記憶體與維持模型能力，且對繁體中文的理解效果十分優異。 NVFP4：針對NVIDIA顯示卡特別優化的四位元浮點數格式，具備強大的加速效果。

2. 本地與雲端推論工具比較 Ollama / LM Studio：介面簡潔且易於上手，用戶數量多，但缺點是目前無法跨機器建立叢集(Cluster)。若需使用雲端大型模型（如養多隻龍蝦的應用），可付費購買其Pro或Max方案連接雲端，或直接使用雲端的Claude。 vLLM：針對大型模型伺服器設計的專業工具。雖然設定較為複雜，但它支援多台機器的叢集(Cluster)推論，能運行更大的模型，且運算速度快、記憶體使用效率佳。 MLX (Apple 架構)：受惠於M4/M5晶片的「統一記憶體 (Unified Memory)」設計（CPU與GPU共用記憶體），載入模型速度極快，甚至可利用多核心CPU運行如千問300B等級的龐大模型。但需注意：推論時的記憶體頻寬不如獨立顯示卡，且經過量化與Apple格式轉換後，實測時常有較嚴重的模型幻覺發生。

模組三：AI 輔助程式開發方法論

現代軟體開發模式：目前的程式碼幾乎都由AI撰寫，工程師的角色已轉變為「測試、驗證與調整」。
專案經理式開發法：不可要求AI一次把完整程式寫到位（容易導致專案走偏），應採「教導方式」，將開發拆分成多個步驟，每完成一步就進行Review與調整。
乘法效應與基礎能力：AI是能力的放大器（例如乘以10倍），但工程師本身必須具備基礎能力。若原有實力為100分，AI能將其放大至1000分；若基礎不佳只有60分，放大後也僅有600分。
AI取代的範疇：多國語言轉換、程式微調等「重複性工作」將被AI取代。但因為AI模型仍屬於「程式接龍」的概念，缺乏自主意識，因此發想創意 (Idea) 仍需仰賴人類大腦。

模組四：產業動態與AI新聞
Google免費AI線上認證：全程約兩小時的Open Book測驗，非常適合用來釐清AI應用概念並獲取證照，對求職有幫助。
OpenAI技術授權解綁：因微軟平台上的OpenAI模型更新速度緩慢，OpenAI正著手將技術授權給Amazon等其他企業，打破過往的綁定關係。

股票回測工具：金融投資必須有策略，建議利用AI與歷史資料進行「股票回測」，驗證策略可行性以避免成為韭菜。
DeepSeek-V4 模型落地：擁有1.6T (1600B) 參數的開源巨型模型，完整下載需約895.6GB。其採用類似人腦的架構，每次推論僅需啟動其中約49B的參數，能在個人電腦上實現落地執行。
聯發科台語辨識：聯發科基於Whisper技術，成功訓練出專用的台語辨識模型。

機器人硬體技術：現在的機器人四肢運動（體操、武術、跑馬拉松）已超越人類，甚至出現結合XY滑台與機器手臂的桌球機器人。不過，目前「手部」的靈巧度依舊無法匹敵人類，學界正嘗試用「拉動仿造肌肉纖維」的新方式來改善機械手控制。
模組五：工具推薦與操作資安防範
主力開發工具建議：目前寫程式推薦以 Claude 為主力。若產出的程式碼不盡理想，可切換至 GPT-5.5 嘗試，或利用 Codex 進行程式碼審查 (Review)，檢查是否有資安漏洞。

Agent 遙控電腦的安全警告：AI (如Codex) 具備遙控操作電腦的能力，但強烈規範必須使用「限制資料權限的閒置電腦」來進行測試。切勿使用日常的主力工作電腦讓AI操作，以免發生AI失控亂刪檔案的慘劇（講師近期即遭遇此狀況，幸好有備份）。

29/04/2026

酷媽的內湖新總部，非常的漂亮！😊

23/04/2026

🎨【重磅更新】AI 易付卡全面支援 ChatGPT Image 2！🎨
OpenAI 於 2026 年 4 月 21 日正式推出 ChatGPT Images 2.0（底層模型 GPT Image 2），這是第三代旗艦級圖像生成模型，現在透過「AI 易付卡」就能立即體驗！
━━━━━━━━━━━━━━━
✨ 五大核心突破
━━━━━━━━━━━━━━━
🧠 業界首創「思考型」圖像生成
生圖前會先分析構圖、規劃版面、甚至即時搜尋網路資訊，不再只是一次性出圖，而是可驗證的創作流程。
🔤 文字渲染準確率近 99%
中文、日文、韓文、印地文等多語系全面優化，海報標語、品牌名稱、手寫筆記都不再出現錯字或扭曲字元。
🖼️ 2K 高解析度輸出
支援 3:1 超寬幅到 1:3 直立比例，橫幅、簡報、手機版型一次搞定。
📚 一鍵生成 8 張連貫圖像
角色、物件、風格全系列保持一致，漫畫分鏡、社群系列貼文、品牌形象包一次到位。
🎯 指令遵循大幅提升
複雜多重條件的 prompt（指定版面 + 嵌入文字 + 風格方向）都能精準達成，真正達到商用工作流程等級。
━━━━━━━━━━━━━━━
💡 特別適合這些應用
━━━━━━━━━━━━━━━
✅ 在地化廣告文宣（中文標語超精準）
✅ 資訊圖表、教學素材
✅ 社群貼文系列視覺
✅ 產品 UI 模擬稿、海報設計
✅ 漫畫、故事插畫創作
━━━━━━━━━━━━━━━
🎁 立即體驗 ChatGPT Image 2
━━━━━━━━━━━━━━━
👉 AI 易付卡一卡搞定，免註冊海外帳號、免綁信用卡

#圖像生成 #立達軟體

21/04/2026

台大人工智慧實作課程 AI大數據分析實作（分類、迴歸、時間序列）

一、系統操作與分類模型基礎

資料分析分為「分類」、「迴歸」跟「時間序列」這三種。以鐵達尼號（Titanic）資料集為例，使用者依序點選 open training input file 和 open inference input file 即可載入資料。

系統內部支援多種機器學習演算法，其中 XGBoost 比較通用，而 LGBM 則適用於資料筆數超過一萬筆時，預測會比較準確。大數據分析通常只需利用 CPU 進行加速即可，GPU 的加速效果不如影像分析或大型語言模型那樣明顯。在執行自動分析後，系統會產出基於推論組正確率排名的報表。在訓練資料與推論資料比數為 1:1 的情況下，推論的正確率大約落在 75% 左右。然而在學術界作法中，若將訓練與推論資料比數調為 9:1，正確率自然就會大幅提升。

---

二、資料空間（Data Space）與資料清洗

在建立 AI 模型時，心中必須要有「資料空間」的概念，也就是要評估收集到的資料在空間內分佈是否夠完整。為了解決人類大腦難以理解高維度空間的問題，通常會將三維或更多維度的資料，依序壓扁並映射（Mapping）到二維平面上來進行視覺化。若測試資料剛好落在訓練資料分佈的範圍附近，模型預測就會很準；如果落在空間外，預測就會失準。

在進入訓練前必須先做資料清洗，主要包含剔除冗餘（redundant）的重複資料以及不合理的值（outlier），以避免拖慢訓練速度並提高準確性。此外，業界在訓練模型時，為了證明模型的強健度（Robustness），會將比例反轉為訓練佔 1、測試佔 9，其關鍵依然在於盡可能收集會落在測試點位附近的訓練樣本。

---

三、關鍵因子（Feature Importance）與數學函數概念

所有的 AI 分析本質上都能用數學函數 f(X1, X2, X3,...,Xn) = Y 來表示，X 代表輸入的變量，Y 代表預測的結果。舉例來說，若要預測台積電今天的收盤價，輸入的關鍵變量就可以包含早上的開盤價、昨天的收盤價與成交量等。

特別強調，千萬不要將多個預測目標（如收盤價與成交量）混在同一個模型裡預測，這會造成相互干擾導致不準，應該拆分成獨立的模型來訓練：

f(X1, X2, X3, ..., Xn) = Y1
f(X1, X2, X4, ..., Xn) = Y2

透過系統內的 SHAP 分析，可以抓出影響預測的關鍵因子。在鐵達尼號的案例中，「性別」（佔約 65%）與「艙等」（佔約 22%）是決定生存與否的絕對關鍵，兩者相加幾乎決定了 90% 的存活率，而年齡與票價反而不重要。一旦找出了關鍵因子，就可以把不重要的變數從資料庫中刪除並重新訓練，這樣不僅能減少雜訊干擾，還能維持一樣好的準確度。另外，當輸入的特徵（X）變多時，所需準備的訓練樣本數就會呈現幾何級數（如相乘）的暴增，才能確保資料空間的均勻度。

---

四、演算法特性與非線性資料（Non-linear Data）測試

演算法的運作方式會影響其速度，例如 XGBoost 是使用數學上的二元樹（If-Else 邏輯）來代替神經網路，因此運算速度非常快；相對地，傳統類神經網路因為需要計算複雜的激活函數，運算量就大很多。

為了驗證演算法是否能夠處理非線性資料，實務上常會輸入正弦波（Sine wave）或 XOR 資料集作為量測標準。測試結果顯示，多重線性迴歸（Multiple Linear Regression）明顯無法支援正弦波的預測，只會畫出一條直線。而老牌的支援向量機（SVM）在面對非線性資料時也容易產生偏差（bias）；LGBM 則因為餵入的資料筆數太少而表現不佳。總結來說，最推薦 XGBoost 演算法，無論是運算速度、分類還是迴歸表現，整體性能都相當優異。

---

五、迴歸分析（Regression）與進階演算法

相較於分類模型輸出類別，迴歸（Regression）模型的目標是預測出具體的數值（例如預測波士頓房價的具體數字）。
---

補充重點

資料空間：超過二維的資料壓縮到二維平面，易於了解。

資料分析 SOP：建立模型，先定義輸入 X 及輸出 Y，再找出 f，由 X 算出 Y，並找出特徵參數。單一模型只預測一個變量，若有多個輸出應拆成多個模型。

非線性支援測試：用 sin 及 xor 的資料集決定演算法是否可以支援非線性。

---

分類演算法（Classification）與特徵重要性

特徵分析（Feature Importance 與 SHAP）：模型分析結果顯示，「性別」與「艙等／票價」是影響生存率的關鍵特徵。

模型優化原則：實務上（如股票預測）常會輸入數千個特徵，但真正具影響力的往往只有少數幾個。剔除不重要的特徵不會降低準確率，反而能避免模型受雜訊干擾，提升運算效率。

---

迴歸分析（Regression）與演算法評估

實作案例：正弦波（Sine wave）非線性預測與波士頓房價預測。

演算法比較：

SVM（支持向量機）：運算與推論速度極快，為早期算力不足時的主流。

LightGBM：適合處理一萬筆以上的巨量資料，但不適合用於預測股票或金融指數（易出現鋸齒狀誤差）。

XGBoost：預測表現優異，為最推薦的首選演算法。

線性迴歸：無法準確預測具備非線性特徵的股價。

評估指標：實務與業界更傾向參考 MAE（平均絕對誤差）來評估預測準確度，而非僅看 R-square 或 RMSE。

---

時間序列分析（Time Series）與資料轉換技巧

實作案例：航空公司機位銷售預測。

資料展開技巧：時間序列的核心原理可轉換為迴歸問題。系統會將過去一段時間的資料（如 12 個月的歷史紀錄）展開為多個輸入特徵（X1 到 X12），藉此預測下一個月（Y）的數值。此轉換可直接套用 XGBoost 等迴歸演算法進行分析。

加入外部變數，可大幅提升預測精準度。

21/04/2026

🔥 台大 AI 實作課程｜Claude 全家桶一次打包帶走！ 🔥
還在單打獨鬥跟 AI 搏鬥嗎？這堂課讓你把 Claude 生態系一次玩透透！🚀

🎯 三大主力全方位實戰
💬 Claude Chat｜打造專屬角色與語氣，讓 AI 成為你的最佳拍檔
💻 Claude Code｜Paper code 實作、Linux NAS 同步開發，工程師的夢幻工具
🤝 Claude Cowork｜Word / Excel / PowerPoint / VS Code 無縫整合

⚡ 頂規裝備火力全開
🧠 Claude Opus 4.7 1M Max（業界最強模型）
🖥️ AI 硬體 × AnyDesk 遠端神器
📋 CLAUDE.md 專案記憶管理術
📊 使用量監控技巧｜10 時段 × 5 小時，精準對應上班節奏

🌟 獨門秘技大公開
✨ Vibe Coding × Harness Coding 雙模式開發
✨ Claude Design｜設計也能 AI 化
✨ Browser Use / Computer Use｜讓 AI 幫你操控整台電腦
✨ 龍蝦 🦞 與其他 AI Agent 終極對決

🎁 註冊安裝 × 資費方案 × 避雷指南，手把手帶你入門，零基礎也能變大神！
👉 現在就按讚 + 分享，把這堂 2026 最硬核的 AI 課程鎖起來！💪

#程式開發 #生產力神器 #2026必修課

立達軟體

07/05/2026

05/05/2026

05/05/2026

05/05/2026

04/05/2026

02/05/2026

01/05/2026

29/04/2026

23/04/2026

21/04/2026

21/04/2026

Address

Opening Hours

Website

Alerts

Shortcuts

Share

Category

Monday	09:00 - 18:00
Tuesday	09:00 - 18:00
Wednesday	09:00 - 18:00
Thursday	09:00 - 18:00
Friday	09:00 - 18:00