立達軟體

立達軟體 立達軟體科技曾參加國際AI大賽獲得第一名美金10萬元!致力於降低人工智慧門檻,讓人工智慧變簡單。幫助客戶解決產業問題,每年節省1億元以上費用,無論是產品競爭力、技術門檻,以及與企業的對接度等項目,均獲得非常高的評價!目前正進行B輪募資中,拓展全球市場。

人工智慧 GPU 電腦、工作站、伺服器 - 線上估價:
https://www.myai168.com/gpucomputer/

AI易付卡
https://www.myai168.com/tw/ai/

MYAI教育平台:
https://www.myai168.com/tw/

立達軟體官網:
https://www.leaderg.com/tw

如果有線上或線下授課需求,歡迎來電或來信洽詢:
電話:02-2784-9788
電郵:[email protected]

07/05/2026

別人花錢搶學的AI課,桃園人竟然免費就能上!

💡 學會用AI清洗數據、打造代理人、秒出行銷素材
🎨 從文宣製作到視覺提案,5堂課全面升級職場技能
🤖 不只懂AI,還會用AI實際產出工作成果

📅 課程時間
5/06 數據淨化術:品質優化與實戰清洗|19:00–22:00(3小時)
5/12 打造你的AI代理人數位特種部隊|19:00–22:00(3小時)
5/14 文宣快手技:優質型錄極速生成|19:00–21:00(2小時)
5/21 品牌煉金術:行銷素材全能產出|19:00–22:00(3小時)
5/28 提案瞬移術:視覺化商務溝通|19:00–22:00(3小時)

「政府免費補助AI課,猶豫的人已經輸在起跑點了!」
🔗 立即報名(額滿截止)
https://forms.gle/9QpzXYEFAVr4eCFN8

[注意事項]
1. 桃園市轄內設籍、居住、工作者或替代役男優先報名
2. 完課並填寫問卷心得,有機會獲選5名佳作(有獎勵)

服務窗口:[email protected]|☎️ 0800-458688 黃先生

[主辦單位]
桃園市政府就業職訓服務處 × 智慧產業學院

05/05/2026

台大人工智慧實作課程 AI影像辨識實作 (類神經網路影像辨識)

一、開場與課程脈絡

CNN 從 1998 年 LeNet(Yann LeCun)開始,至今約 28 年。2012 年 AlexNet 用兩張 GPU 在 ImageNet 競賽奪冠,世界從此進入算力競賽,深度學習自此爆發。本課程以業界實作觀點介紹 CNN 影像辨識,涵蓋 Dense、Convolution、Pooling、激活函數、發展史與四大應用:影像分類、物件偵測、語義分割、物件分割。

二、業界使用評論(講師心得)

VGG 是講師最愛,效果最好,過去多數案子都用它當主力。GoogLeNet 效果沒特別好,後來就沒再用。ResNet 用得少,講師偏好 VGG16。GAN 生成對抗網路現在較少用,多被大型模型取代。R-CNN 系列效果不太好。

U-Net 講師很常用,原版即很好用,U-Net++ 等變體也好用。FCN 效果較差,不喜歡用;Mask R-CNN 內含 FCN,分割效果都不好。

YOLO v1 到 v3 從 v3 開始爆紅,速度快效果好。YOLOv4 出現後整個影像辨識大爆發,台灣中研院資訊所有參與。SSD512 是講師過去最愛之一,效果優於早期 YOLO。MobileNet 小網路效果差。RetinaNet、PSPNet 用得很少,DeepLab 號稱醫療影像常用但講師沒用過。

EfficientNet 一點都不 efficient,網路很大但效果沒很好,跳過。CSPNet 是台灣之光,由中研院資訊所廖弘源所長與王建堯博士團隊提出,可大幅降低算力需求且精度不掉。HRNet 在工業檢測、農業田間有實用價值。

ViT 把影像切成 16x16 patch 做 embedding 後丟進 Transformer Encoder。DETR 是 CNN 加 Transformer 結合,Facebook 出品。YOLOv5 是 Ultralytics 把 v4 改寫成 Python 版,採雙授權(GPL 或付費),但現在 AI 半小時就能改寫變數命名與架構,雙授權實際意義已變低。

ConvNeXt 看似厲害,講師沒用過。Stable Diffusion 過去很紅,現在多被大型模型如 GPT-Image-2 取代。YOLOv7 是講師目前主力(非雙授權,且有 C++ 程式),人流系統、瑕疵檢測都用,效果好速度快。SAM 與 SAM 2 是影像切割目前最強的,SAM 2 為兩年前發表。RT-DETR 屬 Transformer 即時偵測。YOLOv26 是 Ultralytics 最新,雙授權,講師不喜歡用。YOLOv11 到 v14 多由 Ultralytics 出品,其他團隊也借 YOLO 名字發論文。

小故事:YOLOv1 到 v3 原作者 Joseph Redmon 認為這項技術會毀滅人類,於 v3 後退出。後由 Alexey 接手,與台灣中研院廖所長、王博士合作做出 v4,台灣參與了 v4、v7、v9 三代。
三、Dense 全連接層

公式:y = h(W·x + b)。每個神經元接收上一層所有訊號,乘以權重後加總、加偏置、再代入激活函數。學者普遍認為人腦不是這樣運作,但目前還沒有更好的模型,所以大家沿用。

Dense 不適合處理影像:224x224x3 影像直接展平接 1024 Dense 約需 1.5 億參數,但 3x3 卷積核只需約 864 參數,且保留空間結構。Dense 完全忽略影像的局部相關與平移近不變先驗,因此影像處理通常前面要加 Convolution Filter。

四、Convolution 卷積

卷積運算以 3x3 Sobel 系列濾波器這種滑動視窗逐區計算加權總和,產生 feature map。Stride 是滑動視窗一次移動的距離(如 stride=2 表示每次跳 2 格),Padding 在邊緣補零保持輸出大小。

多通道與權重共享:RGB 影像卷積核需 3x3x3,K 個核產生 K 個 feature map。同一個核掃過全圖,大幅減少參數,並具備平移近不變性。

感受野方面,多層小核堆疊優於單層大核:兩層 3x3 約等於一層 5x5(參數 18 比 25),三層 3x3 約等於一層 7x7(27 比 49)。

五、Pooling 池化

Max Pooling 取最大值,Average Pooling 取平均,其他還有 L2 Pool、Strided Conv、SPP。現代 CNN 兩大趨勢:第一,GAP 對每個 feature map 取全圖平均,大幅減參、降低過擬合,ResNet、MobileNet 採用;第二,Strided Conv 用 stride=2 同時做特徵提取與降維,YOLO 與現代偵測器愛用。

六、深度學習框架演進

從 Caffe 開始,CNN 演算法逐步標準化(convolution、pooling、flatten、dense、softmax 等)。Caffe 研發人員後來加入 Facebook 的 PyTorch 陣營,部分研究者也曾在阿里巴巴服務。目前框架建議學 PyTorch 為主,TensorFlow 目前只有 Google 在維護。

七、激活函數

若激活函數為線性,多層網路等於單層線性。加入非線性後,多層 MLP 才能逼近任意連續函數(通用近似定理)。早期用 Sigmoid、Tanh 容易飽和梯度消失,現代主流為 ReLU 家族。講師補充:他用最好的是 hyperbolic tangent。最新的 GELU、Swish 用於 Transformer 與 LLM。

ReLU 家族成員:ReLU 即 max(0, x);Leaky ReLU 避免死神經元;ELU 與 SELU 負區為指數曲線;GELU 為 BERT、GPT、ViT 主流;Swish 與 SiLU 為 EfficientNet、Swin 採用;Softmax 用於輸出層做多類機率分佈。重點:選激活函數要找非線性,線性效果不好。

八、CNN 演進歷史簡表

引爆點 AlexNet(2012)將 ImageNet Top-5 錯誤率從 26% 拉到 15.3%,約 6000 萬參數,首次用 GPU 加速,引入 ReLU、Dropout、資料擴增。LeNet-5(1998)當時用於手寫數字辨識,例如 MNIST 與銀行支票。

主要里程碑:1998 LeNet-5、2012 AlexNet、2014 VGG16/GoogLeNet/GAN、2014-15 R-CNN 家族、2015 ResNet/U-Net/FCN/YOLO v1、2016 SSD/DenseNet、2017 MobileNet/Mask R-CNN/RetinaNet/PSPNet、2018 DeepLab v3+、2019 CSPNet/EfficientNet/HRNet、2020 YOLOv4/ViT/DETR/Diffusion/YOLOv5、2021 Swin Transformer、2022 ConvNeXt/Stable Diffusion/YOLOv7、2023 SAM/YOLOv8/RT-DETR、2024 SAM 2/LLM 多模態(GPT、Gemini、Claude、Llama)/YOLOv9/YOLOv10、2025 RF-DETR/YOLOv12、2026 YOLOv26。

多模態時代(2024 之後)的 Transformer 輸入輸出不只是文字,還可以包含影像、聲音。目前影像分析、影像生成大多走多模態路線,例如 GPT 的 image generation 直接用 LLM 完成。

九、影像辨識四大應用

9.1 影像分類:輸入一張影像,輸出單一類別,例如蝴蝶蘭、文心蘭等花卉。指標包括 Top-1 與 Top-5 Accuracy、Precision、Recall、F1、ROC-AUC、Cohen κ、Confusion Matrix。遷移學習指在 ImageNet 預訓練後用自家資料微調,講師補充:遷移學習其實就是 resume,預訓練完之後接續訓練,可選擇凍結前段、訓練後段,或全部微調。

9.2 物件偵測:找出影像中物件的位置與類別,例如草莓在哪裡,讓機器手臂去抓。兩種主流:兩階段如 R-CNN 家族、Mask R-CNN,準確率高、較慢;單階段如 SSD、YOLO 系列、RetinaNet、EfficientDet、DETR、RT-DETR、RF-DETR,速度快、適合即時。指標:IoU 大於 0.5 視為 True Positive,mAP 是 PR 曲線下面積對所有類別平均,COCO 採 IoU 0.5 到 0.95 取平均。即時應用看 [email protected] 加 FPS,高精度看 [email protected]:.95。

9.3 語義分割:每個像素貼一個標籤,例如 CT 中標出肝臟、胃在哪。經典模型有 FCN、U-Net、PSPNet、DeepLab v3+、HRNet;Transformer 時代有 SegFormer、Mask2Former、SAM、SAM 2。指標包括 mIoU、Pixel Accuracy、Dice。

9.4 物件分割:先做物件偵測,再對每個獨立實例做分割,例如兩隻動物會被分成 1 號、2 號。經典 Mask R-CNN、YOLACT、SOLO,FCN 切割效果通常不好;現代有 Mask2Former、OneFormer、YOLOv8/v26 內建 segmentation、RF-DETR。目前主流為 SAM 2。
十、業界實務建議

影像分類用 VGG16,新案可考慮 Swin Transformer。物件偵測一般用 YOLOv7(非雙授權、效果好、速度快);過去案子用 SSD512;最新研究用 RF-DETR,下載 GitHub 後請 AI 工具協助執行。語義或物件分割以 U-Net 為主,最新可用 SAM 2。生成用大型多模態模型取代 Stable Diffusion。較難案例搭配 Gemma、Google Gemini、Meta Llama 進一步分析。

講師也分享 AI 加速開發的觀察:現在用 AI 工具改寫程式碼非常快,半小時內就能把 YOLO 變數命名、程式架構整個改寫完畢;下載開源專案後叫 AI 協助執行 train.sh、inference.sh 等腳本,過去要自己改半天的工作 15 分鐘內就能完成。

十一、課後預告

下週實作:影像分類、物件偵測、語意分割、物件分割。

05/05/2026

台大人工智慧實作課程 AI影像辨識實作 (Digital Image Processing)

數位影像處理 上課筆記

教材:Gonzalez & Woods《數位影像處理》第 4 版

【業界觀念】傳統演算法可解則優先採用(算力低、可解釋);不可行再用 AI。

第 1 章 緒論
- 影像數學定義:灰階 f(x,y)、彩色 f(x,y,c);多光譜 RGB+NIR、高光譜可達上千通道。
- 三層概念:影像處理(影像→影像)、影像分析(影像→屬性)、電腦視覺(模擬認知決策,AI 分支)。
- 處理層級:低(去雜訊)、中(特徵)、高(認知)。
- 起源:報紙跨海傳輸、太空計畫、醫學影像(CT 為多 X 光重建切片)。
- 電磁頻譜應用:可見光 400–700 nm;NIR 400–2300 nm(葉綠素、氮肥、糖度);UV/EUV(補牙、光刻機);Gamma 為高頻電磁波;MRI(液態氦超導磁場);超音波;電子顯微鏡(TEM/SEM,可見原子)。
- 系統流程:擷取→增強→復原→分割→特徵→分類→知識庫。

第 2 章 數位影像基礎
- 人眼類比:水晶體=鏡頭、虹膜=光圈、視網膜=感光元件;盲點為演化遺留;視錐細胞約 6–7M 集中於中央窩。
- 解析度:HD≈2M、4K≈8M 已超過視錐細胞;個體差異大。
- Mach Band:相同灰階受鄰域對比影響。
- 取樣(空間離散化)+ 量化(亮度離散化);常見 8 bit 256 階;4 bit 出現假輪廓。
- 印刷 300 DPI、螢幕 72 DPI。
- 內插:最近鄰(保留原色,預設)、雙線性、雙三次(效果好但較重)。
- 連通:4 相鄰、8 相鄰(首選)、m 相鄰。
- 距離:歐氏距離(Embedding/ArcFace 常用)、City Block、Chessboard。
- 校正:標準色板做亮度與空間校正。
- 變換:旋轉/平移/縮放多用 OpenCV;高頻固定倍率縮放可寫組合語言加速。
- 影像配準(Registration):機器手臂校正歪斜物。

第 3 章 亮度轉換與空間濾波
- g = T(f);亮度變換:負片、對數、Gamma(Photoshop 常用)。
- 應用:乳房 X 光攝影偵測纖維化硬塊(分十級)。
- 對比拉伸/灰階切片+二值化(前景分離)。
- 位元切片:高位元為主結構,低位元寫浮水印不易察覺。
- 直方圖:拉伸、均化(Equalization)、匹配。
- 空間濾波:平滑(Low-pass)、銳化、邊緣偵測。
- 業界難題:刮痕/劃痕強化(含長度量測),講師公司核心 know-how。
- 中值濾波對抗椒鹽雜訊;Sobel 為最常用邊緣 filter;Laplacian 銳化;低/高/帶阻;通常需多濾波組合。

第 4 章 頻率域處理
- 工具:DFT/FFT(傅立葉);觀察主頻+次頻。
- 案例:煉油廠以頻譜判斷馬達是否將損壞。
- CNN 概念:Sobel/Laplacian/Gaussian 都是 filter,將其權重交由倒傳遞學習=convolution。
- 規則頻率雜訊:轉頻率域→塗黑亮點→反轉回空間域,雜訊消失。

第 5 章 影像復原與重建
- 椒鹽雜訊也可頻率域去除;自適應濾波器實務少用。
- 工廠/田間 sensor 良好,較少復原;遙測、太空影像才常用。

第 6 章 彩色影像
- 加色法 RGB(螢幕);減色法 CMYK(印刷,K 補純黑)。
- 色彩空間:RGB/CMYK/HSI/LAB/XYZ/NDVI(遙測,加 NIR)。
- HSI/LAB 用於迴歸分析;CIE 色度圖。
- 偽彩色亮度切片:如溫度 0–20°C 由藍至紅。
- 色彩切片應用:採草莓鎖定紅色區。
- 色彩補色(通道反向);色調校正常用。
- JPEG/色彩分割多用既有套件。

第 7 章 小波(Wavelet)
- 曾紅極一時,現實用性下降;案例:洋香瓜紋理推甜度、地質油探。

第 8 章 影像壓縮與浮水印
- 浮水印寫低位元平面,肉眼不察。
- 壓縮:Huffman、變長編碼、字典查表(類 Zip)。
- 自行實作少,多直接呼叫套件。

第 9 章 形態學
- 侵蝕、膨脹(OpenCV 直接用);Opening=先侵後膨(去突出);Closing=先膨後侵(補凹洞)。
- 連通元件(八/四相鄰)、邊界擷取、孔洞填補。
- 細化/粗化(骨架):印字、刮痕長度。
- 灰階形態學、Open/Close、侵蝕膨脹皆實務常用。

第 10 章 影像分割
- 邊緣偵測:Sobel(首選)、Canny、Laplacian(指紋)。
- Hough Transform:刮傷/刮痕。
- 二值化:固定門檻、Otsu 自動門檻、多重門檻、區域性門檻。
- 區域成長(Region Growing)以八相鄰擴張;講師葉片研究即此概念,後人稱為語意分割(Semantic Segmentation)。
- 超像素/圖分割/分水嶺:少用。
- 現代主流:U-Net、Instance Segmentation(YOLO 系列)。

第 11 章 特徵擷取
- 面積最常用(葉子、IC 邊緣崩缺)。
- 特徵須 robust(光照不變)。
- 紋理:香瓜糖度。
- Harris 角點:自走車導航、立體視覺比對。
- SIFT:影像比對。
- 邊界追蹤、簡化邊界、PCA、主成分影像:實務少用。
- 趨勢:傳統工具逐步被深度/變形網路取代。

第 12 章 影像樣式分類
- Pipeline:預處理→特徵擷取→分類→標籤。
- 距離分類器:歐氏距離、最小距離;模板比對;結構比對(二元樹);貝氏分類器。
- 啟動函數:Sigmoid(無負值,較弱);Tanh(輸出 [-1,1],講師長期首選);ReLU(GPU 友善但非線性問題弱)。
- 多層感知機:兩層 10 神經元為早期常用;三層提升有限但訓練久。

05/05/2026

台大人工智慧實作課程 人工智慧新聞 20260505

課堂筆記

一、紅杉資本(Sequoia Capital):AI 是放大個人能力的槓桿

紅杉資本是美國知名投資公司,他們有一支影片講得非常好,主題是「AI 是槓桿,能放大自己的能力」。

我用 Google 的 NotebookLM 把影片轉成逐字稿,再透過 Claude 修正錯字與標點符號,整理成可閱讀的文稿。

核心觀點:
現在 AI 時代改變了很多事,最近股市大漲也是因為 AI。很多原本需要付費的工作正在被 AI 取代,例如軟體工程師。工程師現在主要負責「下指令、看結果、測試」,程式碼大部分由 AI 撰寫。一個工程師的能力等於放大 10 倍,相當於以前的 10 個工程師。軟體公司人力需求大幅下降,但對「厲害工程師」的需求反而提高。因為「乘以 10 倍」的效果,本身能力強的人會變得超強,初學者乘以 10 倍效果有限。結論:中等以下的專業人員容易被 AI 取代,頂尖的工程師、醫生、會計師仍無可取代。

二、本週技術新聞

MLX 框架
MLX 是 Apple 為 Mac 推出的專屬深度學習框架,速度看起來很快,但可能是「犧牲精度換速度」,需要實測幻覺情形。之前有客戶用標榜跑很快的框架做應用,幻覺問題嚴重,最後無法採用。

大陸四足仿生機器人
現在已經做到防水、防塵,能上山下海,在這個領域大陸做得非常好。

GPT Image 2
強烈推薦各位試用,做海報、繁體中文都非常精準。

我昨天用它幫一場 800 多人的線上演講做封面圖。第一次咒語:「請畫一個工程師透過槓桿翹起軟體的 bug」。第二次咒語:「請加上用了 Claude AI 可以放大十倍個人能力」。它就自動把背景文字(思考、計劃、寫程式、測試、Ship High Quality Code、Build、Improve、Repeat)都畫上去,整張海報不到 10 分鐘完成。也可以把公司名或實驗室名稱放上去。

為什麼這麼厲害?參數量至少 400B,頂尖模型甚至到 1600B。人腦大約 100B,1600B 約等於 16 個人腦的容量。採用 MoE(Mixture of Experts,混合專家模型)架構,一次只啟動少部分專家來回答問題(例如 16 個專家中啟動 2 個)。這是模仿人腦:做特定問題時只啟動特定區域,不是整個腦袋都運算。速度快、效率高。

Anthropic 的紅線
Anthropic 拒絕兩件事:第一,拒絕用 Claude 監控美國人民。第二,拒絕將 Claude 用於「無人類決策」的國防武器(不需人類同意就能殺人的機器)。結果被美國政府列入黑名單。但 Anthropic 靠 Claude API、Claude Enterprise 等民間業務已經賺得盆滿缽滿,國防部的錢只是小部分,所以這條紅線守得住。Google 也有部分工程師因為公司涉入軍事領域而選擇離職。

Enzo Tseng(無毒農創辦人)
原本是「好書服文創」創辦人,現在做「無毒農」。他積極導入 AI 到公司業務中(例如 LINE 客服),除了寫程式厲害,商業邏輯也很強,值得追蹤。

三、Claude 4.8 與 AI 加速教材製作

最近我做投影片都靠 AI。

範例一:影像處理聖經(教科書)。抓網路上的 PDF,用 Claude Code 一次生成一個章節,自動把英文 PDF 轉成中文投影片,連截圖都是 AI 處理。12 個章節 × 10 分鐘 ≈ 120 分鐘。排版錯誤再用 Claude for PowerPoint 修正。整本書的投影片只花 2~3 小時。

範例二:類神經網路影像辨識教材。從 1998 年的 LeNet(最早做銀行支票簽名比對),一路到最新的 YOLO v26。把業界常用的網路完整介紹,配圖、排版全部 AI 處理。一個晚上做出兩份投影片,一份 60 多張、一份 100 多張。

重點是「給 AI 一個 idea」,告訴它要呈現什麼。AI 是大殺器,可以節省 10 倍以上時間,做得又快又好。

四、Agent Workflow 與 AI 加速 AI 開發

Claude Code、Claude Sonnet(中階模型)、Claude Opus(最聰明)。寫複雜工作(如投影片)建議用 Opus。Anthropic 內部 75% 以上的程式由 AI 撰寫。我自己公司目前 95% 以上由 AI 撰寫。

類比編譯器的演進:早期只能寫很簡單的編譯器,後來用編譯器製造編譯器,一代一代疊代。現在 GCC、Visual Studio、Intel Compiler 都非常成熟。AI 也是一樣,會自我加速開發。

目前是非常特別的時間點,自從 ChatGPT 出來之後所有事情都加速了,台股漲翻天也是因為 AI 需求暴增。

五、其他新聞

心跳偵測 Sensor
能偵測心跳的電磁波變化,但有點匪夷所思,需要驗證。

OpenAI Agent / Codex CLI
我有試過 Claude Code、OpenAI Codex,目前 Claude 用起來最聽得懂人話、回答最人性化。

Google Gemini
除了 Antigravity 之外,還有 CLI Interface,各家都有。Claude 在 Linux 也有 CLI 介面,但 console 介面用起來不夠順,我目前是在 Windows 上用 GUI 視窗,再透過 NAS 同步檔案到 Linux。

NVIDIA 全球銷量排行
美國第一。新加坡第二(很多是大陸去投資的資料中心,或從新加坡轉運到大陸)。台灣也有不少轉運到大陸。馬來西亞也有類似情況。之前有人在抖音大喇喇秀廠牌就被抓了。美國禁止 AI 高階硬體輸出到大陸。

Claude 流量問題
昨天晚上 9 點多 Claude 突然壞掉,因為美國端流量太大暫停服務,休息一小時後恢復。

六、用 AI 改造專案

我公司有一個專案,原本約 20 萬行 PHP,用 AI 改寫成 Python 後變成 10 萬行,還加上資安防護,幾千個檔案大約兩週完成。以前可能要 3 個工程師做一年。

七、其他有趣議題

圖片壓縮上下文
有人提出用「圖片」方式壓縮 LLM 上下文,但記憶會變模糊。類比:有些人讀書是「拍照式」記憶,把書當影像存進腦子,瞬間記很多東西,考試很有用,但考完就忘。真正消化知識還是要 token 化(文字化)。睡眠時大腦可能在做訓練(做夢),所以讀書時睡眠不足,長期記憶無法形成。

CTO 重回寫程式
現在很多 CTO 又開始專注寫程式,因為寫程式變成一種享受。(我每天都弄到兩三點,現在寫程式很像打電動,看 token 用量百分比,不甘心沒用完就撐著,AI 跑的時候可以休息 5 到 10 分鐘)

電池技術
三元鋰電池:能量密度高,較貴。磷酸鋰鐵電池:成本低,大陸電動車(電驢)常用。

AI 很喜歡哥布林(Goblin)
不知道為什麼 GPT 訓練資料裡好像很多哥布林相關內容,要用 system prompt 去壓制。每個 AI(OpenAI、Claude)都有自己的 system prompt,常被反組譯出來研究。

資料庫被清空慘案
我有遇到下錯指令、或下到模糊指令,AI 直接把資料庫清空,超嚇人。重要建議:動資料庫前一定要先備份。用 Claude Code、OpenAI Codex 等工具建議在獨立電腦上執行。全線開放權限要謹慎。注意 rm -rf 手滑提早送出的風險。

Neuralink
馬斯克投資的腦機介面公司,植入微小探針到大腦,透過藍牙傳輸,可控制機械手臂、讓視障者看到模糊影像。

達克效應(Dunning-Kruger Effect)
從無知到專家會經歷的階段:無知時自信程度最高(高估自己)。經過社會打擊後跌入「絕望之谷」。經驗累積後自信慢慢上升。公司發展曲線也有類似效應:前期過熱 → 冷卻 → 緩步上升。

Suno 與華納音樂和解
拿一筆錢給華納,華納就讓 Suno 訓練,本質上就是為了錢,這也沒辦法,開公司就是為了賺錢。

Sponge Pong 乒乓球機器人
上週有提到。

課堂安排

休息到 10:10,回來後會講:第一,數位影像處理:什麼是數位影像。第二,類神經網路影像辨識:來龍去脈快速過一遍。如果時間不夠,實作部分挪到下週,今天先把基本觀念講清楚。

感謝國立臺北科技大學訂購配備四張 NVIDIA RTX-PRO6000-96G 的人工智慧伺服器。😄
04/05/2026

感謝國立臺北科技大學訂購配備四張 NVIDIA RTX-PRO6000-96G 的人工智慧伺服器。😄

電腦線上估價:人工智慧 GPU 、桌機、工作站、伺服器,價格優惠透明。領先業界,採用精選高品質零件,出廠前皆經過 AI 燒機測試,確保穩定性。立達軟體科技曾參加國際AI大賽獲得第一名美金10萬元,資本額兩億,股票代碼.....

02/05/2026

台大人工智慧實作課程 AI大數據分析實作(分類、迴歸、時間序列、股票預測、金融指數預測)

單元一:AI 輔助學習與自媒體經營
新世代學習工具:可利用 NotebookLM 等 AI 工具建立筆記本,將教學影片輸入後,自動生成課程摘要與逐字稿,甚至可請 AI 幫忙產出測驗題目與簡報,提升學習效率。
自媒體推廣觀念:目前影音平台演算法對專業性質內容的觸及率較低(相較於生活化或娛樂性爆款內容)。若要增加專業影片的曝光度,可以考慮使用 Google Ads 等推廣(Promotion)功能。

單元二:大數據分析基礎與分類模型 (Classification)
利用大數據分析軟體(如 MAS Studio)可進行三大類分析:分類、迴歸與時間序列。
分類模型概念:預測結果為「有或沒有 / 是或否」。例如預測鐵達尼號乘客在船難中是生存(1)或死亡(0)。
核心演算法:
XGBoost:最為通用的演算法,擬合效果好,對於大小數據皆適用,是進行分類或股票分析的首選。
LGBM 與 Gradient Boosting:較適用於一萬筆以上的大量資料。
程式開發:現代分析不一定需要手刻程式,可直接請 Claude、Gemini 或 Codex 等 AI 工具協助撰寫 XGBoost 分析程式。
模型評估與 SHAP 分析:
訓練集正確率通常極高(如 98.75%),推論預測正確率大約在 70% 以上。
透過 SHAP 分析 (Feature Importance) 可以找出影響結果的關鍵特徵。以鐵達尼號為例,影響生死的關鍵為「性別」與「艙等」,若是頭等艙女性,生存率幾乎可達 86% 保證存活。
異常值 (Outlier) 處理:當訓練組預測出錯時,可能是儀器輸入錯誤或偏差,大部分情況應將其剔除;但也需確認是否為真實存在的特殊物理現象,以免刪除具價值的關鍵數據。
產業應用:多光譜分析可利用 XGBoost 篩選出 4 個關鍵波長,用於預測葉片氮肥、水分或水果糖度;結合雲端模型,更能發展出農用感測器的訂閱制商業模式。

單元三:迴歸模型實作 (Regression)
迴歸模型概念:用於預測「具體數值」,例如房屋價格、溫室環境控制參數或雞蛋產量預測。
演算法測試:通常會使用基礎的 Sine(正弦波)或 XOR 來測試演算法的擬合能力。多重線性迴歸無法良好擬合非線性的 Sine 波,而類神經網路 (DNN)、多項式迴歸與 XGBoost 則表現優異。
資料分析標準作業流程 (SOP):
1. 定義 X 與 Y:明確定義輸入特徵 (X) 與要預測的結果 (Y)。如果 Y 有多個變數(如同時預測溫室的水牆、風扇是否開啟),建議拆分成多個獨立模型分別預測,效果會較準確。
2. 建立模型 (找 f(x)):導入演算法進行訓練與推論。 應用案例(波士頓房價預測):透過 SHAP 分析可得知,影響房價的主因包含低收入戶比例 (LSTAT)、房間數 (RM) 以及通勤距離與犯罪率等。 模型評估:可以觀察「殘差圖」,資料點越集中於中間斜線,代表模型預測能力越好。

單元四:時間序列與記憶模型原理 (Time Series)
記憶模型 (Memory Model) 原理:現今的 AI 模型(包含 LSTM、Transformer)大多屬於記憶型模型,依賴「回想 (Record)」過去看過的資料空間來進行推論。如果預測資料落在過去訓練過的資料平面內,預測就會準確;反之,若無相關記憶則會失準。
時間序列特性:輸入的資料 (X) 具有時間先後順序關聯。
應用案例(航空銷售預測):使用過去 12 個月的乘客人數作為「移動窗口」,預測下個月的人數。透過 SHAP 分析可解釋,影響下個月銷售量最大的是「去年同期」(航空業的淡旺季週期性)及「上個月」的銷售成績。

單元五:股票與金融指數預測
資料前處理的核心觀念:因為 AI 是記憶模型,絕對不能直接用「股價」去訓練。如果未來股價飆升超出歷史高點(例如超出訓練空間),模型就會失準。必須將價格轉換為「漲跌幅」或「相對指標(如 KD 線)」,確保訓練資料與預測資料落在同一資料空間內,模型才會穩健 (Robust)。
台積電股價預測實作:
設定 12 天的移動窗口,每天輸入 5 個參數(開盤、最高、最低、收盤、成交量),共 60 筆資料來預測隔日股價漲跌。
SHAP 解析:模型分析顯示,台積電隔日的股價與「前一天的盤中最低價、收盤價、開盤價」高度相關,但與「成交量」關聯較小。這印證了市場散戶常看前一天新聞決定隔天買賣的習慣。剔除不相關的雜訊,模型表現會更佳。

單元六:量化交易實務與 Python 程式自動化
股票交易的三種心態:
1. 先知先覺(內線消息):擁有未公開資訊,獲利最高。
2. 後知後覺(量化與高頻交易):利用 AI 監測籌碼或新聞,透過比散戶更快的「手速」賺錢。
3. 不知不覺(韭菜散戶):不看新聞與盤勢盲目買賣。 量化交易策略觀念: AI 預測通常「當天」或「隔日」最為準確,因此實務上多以當沖或隔日沖為主。 夏普值 (Sharpe Ratio):評估策略好壞的指標,即每承擔 1% 風險能獲利多少 %。數值大於等於 1 算是不錯的策略,小於 1 則代表承擔的風險不值得。 最大回撤:評估在最糟情況下,資金會虧損多少百分比。 Python 自動看盤程式實作: 資料擷取:由於許多網站具有反爬蟲機制,可使用 ZEN 等爬蟲軟體抓取 Google 新聞或證券交易所的即時上下五檔與收盤資料。 綜合策略決策 (多數決模型):
4. 委買委賣壓分析:為了防止假單干擾,建議「剃除極端值」(最高與最低的假單),僅觀察上下三到四檔,會讓模型更穩健。
5. 新聞情緒分析:運用大語言模型判斷即時新聞對該公司的情緒偏向正面或負面。
6. 技術與動能指標:結合黃金與死亡交叉與現價動能。 程式每隔 1 到 2 分鐘自動運行上述策略,透過「多數決」(例如三項策略中有兩項顯示買進)產生最終的買賣訊號,可自行開發介面打造專屬自動看盤工具。

01/05/2026

台大人工智慧實作課程 人工智慧新聞 20260428

模組一:硬體建置與設備選擇指南

1. 顯示卡(GPU)採購與電源安全 高階顯示卡電源線風險:600瓦的高階顯示卡(如5090或Pro6000)容易發生電源線燒毀的問題。華碩針對此問題設計了異色接頭,若接頭露出不同顏色即代表未插緊,以避免因接觸面積過小導致電阻變大、發熱融毀。 首選設備與規格:目前AI購機首選為具備96GB記憶體的NVIDIA Pro6000。 瓦數選擇:強烈建議選擇 300瓦 版本而非600瓦版本。300瓦不僅發熱較少、運作更穩定,且同一個機箱可擴充插滿四張卡(600瓦受限於體積只能插兩張)。雖然兩者效能差距約14%,但300瓦整體實用性更高。 缺貨替代方案:近期5090持續缺貨,可考慮價格相近且同屬專業卡的Pro4500(32GB記憶體)作為替代品。

2. 跨平台測試策略 (Cost Reduction) 若欲使用AMD或Apple設備來節省硬體成本,切勿一開始就在這些平台上開發。 正確流程:先在NVIDIA環境建立「黃金標準 (Golden Sample)」,確認模型運作正常、回答效果佳之後,再將系統移植到AMD或Apple設備上進行比對。這能避免在系統不穩時,誤將硬體產生的落差當作是AI模型本身的「幻覺」問題。

模組二:模型量化格式與推論引擎

1. 模型量化格式解析 GGUF:基於Llama.cpp開發的量化格式,Hugging Face上常見的Unsloth等公司會用此格式來宣傳新模型。除非電腦記憶體真的極少,否則不建議使用GGUF壓縮,因為量化會造成模型智商降低與能力減損。 原生四位元格式 (如MXFP4):若模型在訓練初期即採用四位元訓練(例如將近一年前的GPT-4 120B),則能兼顧節省記憶體與維持模型能力,且對繁體中文的理解效果十分優異。 NVFP4:針對NVIDIA顯示卡特別優化的四位元浮點數格式,具備強大的加速效果。

2. 本地與雲端推論工具比較 Ollama / LM Studio:介面簡潔且易於上手,用戶數量多,但缺點是目前無法跨機器建立叢集(Cluster)。若需使用雲端大型模型(如養多隻龍蝦的應用),可付費購買其Pro或Max方案連接雲端,或直接使用雲端的Claude。 vLLM:針對大型模型伺服器設計的專業工具。雖然設定較為複雜,但它支援多台機器的叢集(Cluster)推論,能運行更大的模型,且運算速度快、記憶體使用效率佳。 MLX (Apple 架構):受惠於M4/M5晶片的「統一記憶體 (Unified Memory)」設計(CPU與GPU共用記憶體),載入模型速度極快,甚至可利用多核心CPU運行如千問300B等級的龐大模型。但需注意:推論時的記憶體頻寬不如獨立顯示卡,且經過量化與Apple格式轉換後,實測時常有較嚴重的模型幻覺發生。

模組三:AI 輔助程式開發方法論

現代軟體開發模式:目前的程式碼幾乎都由AI撰寫,工程師的角色已轉變為「測試、驗證與調整」。
專案經理式開發法:不可要求AI一次把完整程式寫到位(容易導致專案走偏),應採「教導方式」,將開發拆分成多個步驟,每完成一步就進行Review與調整。
乘法效應與基礎能力:AI是能力的放大器(例如乘以10倍),但工程師本身必須具備基礎能力。若原有實力為100分,AI能將其放大至1000分;若基礎不佳只有60分,放大後也僅有600分。
AI取代的範疇:多國語言轉換、程式微調等「重複性工作」將被AI取代。但因為AI模型仍屬於「程式接龍」的概念,缺乏自主意識,因此發想創意 (Idea) 仍需仰賴人類大腦。

模組四:產業動態與AI新聞
Google免費AI線上認證:全程約兩小時的Open Book測驗,非常適合用來釐清AI應用概念並獲取證照,對求職有幫助。
OpenAI技術授權解綁:因微軟平台上的OpenAI模型更新速度緩慢,OpenAI正著手將技術授權給Amazon等其他企業,打破過往的綁定關係。

股票回測工具:金融投資必須有策略,建議利用AI與歷史資料進行「股票回測」,驗證策略可行性以避免成為韭菜。
DeepSeek-V4 模型落地:擁有1.6T (1600B) 參數的開源巨型模型,完整下載需約895.6GB。其採用類似人腦的架構,每次推論僅需啟動其中約49B的參數,能在個人電腦上實現落地執行。
聯發科台語辨識:聯發科基於Whisper技術,成功訓練出專用的台語辨識模型。

機器人硬體技術:現在的機器人四肢運動(體操、武術、跑馬拉松)已超越人類,甚至出現結合XY滑台與機器手臂的桌球機器人。不過,目前「手部」的靈巧度依舊無法匹敵人類,學界正嘗試用「拉動仿造肌肉纖維」的新方式來改善機械手控制。
模組五:工具推薦與操作資安防範
主力開發工具建議:目前寫程式推薦以 Claude 為主力。若產出的程式碼不盡理想,可切換至 GPT-5.5 嘗試,或利用 Codex 進行程式碼審查 (Review),檢查是否有資安漏洞。

Agent 遙控電腦的安全警告:AI (如Codex) 具備遙控操作電腦的能力,但強烈規範必須使用「限制資料權限的閒置電腦」來進行測試。切勿使用日常的主力工作電腦讓AI操作,以免發生AI失控亂刪檔案的慘劇(講師近期即遭遇此狀況,幸好有備份)。

酷媽的內湖新總部,非常的漂亮!😊
29/04/2026

酷媽的內湖新總部,非常的漂亮!😊

23/04/2026

🎨【重磅更新】AI 易付卡 全面支援 ChatGPT Image 2!🎨
OpenAI 於 2026 年 4 月 21 日正式推出 ChatGPT Images 2.0(底層模型 GPT Image 2),這是第三代旗艦級圖像生成模型,現在透過「AI 易付卡」就能立即體驗!
━━━━━━━━━━━━━━━
✨ 五大核心突破
━━━━━━━━━━━━━━━
🧠 業界首創「思考型」圖像生成
生圖前會先分析構圖、規劃版面、甚至即時搜尋網路資訊,不再只是一次性出圖,而是可驗證的創作流程。
🔤 文字渲染準確率近 99%
中文、日文、韓文、印地文等多語系全面優化,海報標語、品牌名稱、手寫筆記都不再出現錯字或扭曲字元。
🖼️ 2K 高解析度輸出
支援 3:1 超寬幅到 1:3 直立比例,橫幅、簡報、手機版型一次搞定。
📚 一鍵生成 8 張連貫圖像
角色、物件、風格全系列保持一致,漫畫分鏡、社群系列貼文、品牌形象包一次到位。
🎯 指令遵循大幅提升
複雜多重條件的 prompt(指定版面 + 嵌入文字 + 風格方向)都能精準達成,真正達到商用工作流程等級。
━━━━━━━━━━━━━━━
💡 特別適合這些應用
━━━━━━━━━━━━━━━
✅ 在地化廣告文宣(中文標語超精準)
✅ 資訊圖表、教學素材
✅ 社群貼文系列視覺
✅ 產品 UI 模擬稿、海報設計
✅ 漫畫、故事插畫創作
━━━━━━━━━━━━━━━
🎁 立即體驗 ChatGPT Image 2
━━━━━━━━━━━━━━━
👉 AI 易付卡 一卡搞定,免註冊海外帳號、免綁信用卡

#圖像生成 #立達軟體

21/04/2026

台大人工智慧實作課程 AI大數據分析實作(分類、迴歸、時間序列)

一、系統操作與分類模型基礎

資料分析分為「分類」、「迴歸」跟「時間序列」這三種。以鐵達尼號(Titanic)資料集為例,使用者依序點選 open training input file 和 open inference input file 即可載入資料。

系統內部支援多種機器學習演算法,其中 XGBoost 比較通用,而 LGBM 則適用於資料筆數超過一萬筆時,預測會比較準確。大數據分析通常只需利用 CPU 進行加速即可,GPU 的加速效果不如影像分析或大型語言模型那樣明顯。在執行自動分析後,系統會產出基於推論組正確率排名的報表。在訓練資料與推論資料比數為 1:1 的情況下,推論的正確率大約落在 75% 左右。然而在學術界作法中,若將訓練與推論資料比數調為 9:1,正確率自然就會大幅提升。

---

二、資料空間(Data Space)與資料清洗

在建立 AI 模型時,心中必須要有「資料空間」的概念,也就是要評估收集到的資料在空間內分佈是否夠完整。為了解決人類大腦難以理解高維度空間的問題,通常會將三維或更多維度的資料,依序壓扁並映射(Mapping)到二維平面上來進行視覺化。若測試資料剛好落在訓練資料分佈的範圍附近,模型預測就會很準;如果落在空間外,預測就會失準。

在進入訓練前必須先做資料清洗,主要包含剔除冗餘(redundant)的重複資料以及不合理的值(outlier),以避免拖慢訓練速度並提高準確性。此外,業界在訓練模型時,為了證明模型的強健度(Robustness),會將比例反轉為訓練佔 1、測試佔 9,其關鍵依然在於盡可能收集會落在測試點位附近的訓練樣本。

---

三、關鍵因子(Feature Importance)與數學函數概念

所有的 AI 分析本質上都能用數學函數 f(X1, X2, X3,...,Xn) = Y 來表示,X 代表輸入的變量,Y 代表預測的結果。舉例來說,若要預測台積電今天的收盤價,輸入的關鍵變量就可以包含早上的開盤價、昨天的收盤價與成交量等。

特別強調,千萬不要將多個預測目標(如收盤價與成交量)混在同一個模型裡預測,這會造成相互干擾導致不準,應該拆分成獨立的模型來訓練:

f(X1, X2, X3, ..., Xn) = Y1
f(X1, X2, X4, ..., Xn) = Y2

透過系統內的 SHAP 分析,可以抓出影響預測的關鍵因子。在鐵達尼號的案例中,「性別」(佔約 65%)與「艙等」(佔約 22%)是決定生存與否的絕對關鍵,兩者相加幾乎決定了 90% 的存活率,而年齡與票價反而不重要。一旦找出了關鍵因子,就可以把不重要的變數從資料庫中刪除並重新訓練,這樣不僅能減少雜訊干擾,還能維持一樣好的準確度。另外,當輸入的特徵(X)變多時,所需準備的訓練樣本數就會呈現幾何級數(如相乘)的暴增,才能確保資料空間的均勻度。

---

四、演算法特性與非線性資料(Non-linear Data)測試

演算法的運作方式會影響其速度,例如 XGBoost 是使用數學上的二元樹(If-Else 邏輯)來代替神經網路,因此運算速度非常快;相對地,傳統類神經網路因為需要計算複雜的激活函數,運算量就大很多。

為了驗證演算法是否能夠處理非線性資料,實務上常會輸入正弦波(Sine wave)或 XOR 資料集作為量測標準。測試結果顯示,多重線性迴歸(Multiple Linear Regression)明顯無法支援正弦波的預測,只會畫出一條直線。而老牌的支援向量機(SVM)在面對非線性資料時也容易產生偏差(bias);LGBM 則因為餵入的資料筆數太少而表現不佳。總結來說,最推薦 XGBoost 演算法,無論是運算速度、分類還是迴歸表現,整體性能都相當優異。

---

五、迴歸分析(Regression)與進階演算法

相較於分類模型輸出類別,迴歸(Regression)模型的目標是預測出具體的數值(例如預測波士頓房價的具體數字)。
---

補充重點

資料空間:超過二維的資料壓縮到二維平面,易於了解。

資料分析 SOP:建立模型,先定義輸入 X 及輸出 Y,再找出 f,由 X 算出 Y,並找出特徵參數。單一模型只預測一個變量,若有多個輸出應拆成多個模型。

非線性支援測試:用 sin 及 xor 的資料集決定演算法是否可以支援非線性。

---

分類演算法(Classification)與特徵重要性

特徵分析(Feature Importance 與 SHAP):模型分析結果顯示,「性別」與「艙等/票價」是影響生存率的關鍵特徵。

模型優化原則:實務上(如股票預測)常會輸入數千個特徵,但真正具影響力的往往只有少數幾個。剔除不重要的特徵不會降低準確率,反而能避免模型受雜訊干擾,提升運算效率。

---

迴歸分析(Regression)與演算法評估

實作案例:正弦波(Sine wave)非線性預測與波士頓房價預測。

演算法比較:

SVM(支持向量機):運算與推論速度極快,為早期算力不足時的主流。

LightGBM:適合處理一萬筆以上的巨量資料,但不適合用於預測股票或金融指數(易出現鋸齒狀誤差)。

XGBoost:預測表現優異,為最推薦的首選演算法。

線性迴歸:無法準確預測具備非線性特徵的股價。

評估指標:實務與業界更傾向參考 MAE(平均絕對誤差)來評估預測準確度,而非僅看 R-square 或 RMSE。

---

時間序列分析(Time Series)與資料轉換技巧

實作案例:航空公司機位銷售預測。

資料展開技巧:時間序列的核心原理可轉換為迴歸問題。系統會將過去一段時間的資料(如 12 個月的歷史紀錄)展開為多個輸入特徵(X1 到 X12),藉此預測下一個月(Y)的數值。此轉換可直接套用 XGBoost 等迴歸演算法進行分析。

加入外部變數,可大幅提升預測精準度。

21/04/2026

🔥 台大 AI 實作課程|Claude 全家桶一次打包帶走! 🔥
還在單打獨鬥跟 AI 搏鬥嗎?這堂課讓你把 Claude 生態系一次玩透透!🚀

🎯 三大主力 全方位實戰
💬 Claude Chat|打造專屬角色與語氣,讓 AI 成為你的最佳拍檔
💻 Claude Code|Paper code 實作、Linux NAS 同步開發,工程師的夢幻工具
🤝 Claude Cowork|Word / Excel / PowerPoint / VS Code 無縫整合

⚡ 頂規裝備 火力全開
🧠 Claude Opus 4.7 1M Max(業界最強模型)
🖥️ AI 硬體 × AnyDesk 遠端神器
📋 CLAUDE.md 專案記憶管理術
📊 使用量監控技巧|10 時段 × 5 小時,精準對應上班節奏

🌟 獨門秘技大公開
✨ Vibe Coding × Harness Coding 雙模式開發
✨ Claude Design|設計也能 AI 化
✨ Browser Use / Computer Use|讓 AI 幫你操控整台電腦
✨ 龍蝦 🦞 與其他 AI Agent 終極對決

🎁 註冊安裝 × 資費方案 × 避雷指南,手把手帶你入門,零基礎也能變大神!
👉 現在就按讚 + 分享,把這堂 2026 最硬核的 AI 課程鎖起來!💪

#程式開發 #生產力神器 #2026必修課

Address

台北市信義區仁愛路四段520-1號7樓
Taipei
110054

Opening Hours

Monday 09:00 - 18:00
Tuesday 09:00 - 18:00
Wednesday 09:00 - 18:00
Thursday 09:00 - 18:00
Friday 09:00 - 18:00

Alerts

Be the first to know and let us send you an email when 立達軟體 posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Share