26/07/2025
[AI Easy Step!] 7 ขั้นตอน ดึงข้อมูลภาพ PDF 60 วิ ด้วย n8n + Mistral OCR เพื่อแปลงเป็น Dashboard Automate OCR ง่ายกว่าเดิม 10 เท่า
💎 การเอาข้อมูลจากไฟล์เอกสาร จำเป็นต้องมานั่งดู ผ่นคอมฯ และเปิดแท็บ Word เพื่อบันทึกข้อมูล ปัญหาเหล่านี้จะหมดไป เพียงคุณใช้ AI OCR เข้ามาช่วย แม้ว่าในไทย จะมีอย่าง Typhoon OCR บัดนี้มาลองของต่างประเทศ
สรุปคลิป Youtube: Understand ANY Document with Native Mistral OCR in n8n! (Step-By-Step Tutorial) จากช่อง SW Automation
🔶 แอพฯ ที่ต้องใช้
1. n8n ตัวกลางรัน Workflow สายพานอัตโนมัติ
2. Google Drive เก็บไฟล์ PDF หรือรูปที่เราสแกนเข้ามา
3. Google Sheets ตารางเปล่าไว้รับค่าจาก OCR
4. Mistral OCR API Extract ข้อความจากทั้ง PDF และรูป
5. OpenAI Chat Model คัดข้อมูลสำคัญแล้วกรอง ก่อนโยนเก็บไปยัง Sheets ในคลิปเลือกใช้ GPT 4.1 mini
🔦 Concept:
🔶 อัปไฟล์เข้า Google Drive → n8n ดึงไฟล์ → Mistral OCR อ่านข้อความ → GPT ช่วยกรองข้อมูลสำคัญ → จัดเก็บลง Sheets → ย้ายไฟล์เก่าเข้าลิ้นชัก Processed
💎 ขั้นตอนดึงข้อมูลภาพ PDF สแกนด้วย Mistral OCR
1. เตรียม API ให้พร้อมและตั้ง Trigger ให้ n8n รู้ว่ามีไฟล์ใหม่
- ลาก Google Drive Trigger มาวาง ต่อด้วย เชื่อมบัญชี Google Drive
- ตั้ง Mode: Every minute (หรือเวลากี่นาทีก็ได้)
- เลือก Trigger on changes involving a specific folder → ชี้ไปโฟลเดอร์ OCR Files
- Event เลือก File Created
2. ดาวน์โหลดไฟล์เข้าระบบ
- ต่อออกจาก Trigger เป็น Google Drive เพื่อ Download File, Resource = File, Operation = Download
- ช่อง File เลือก By ID แล้วดึง {{$json.id}} จาก Trigger
3. แยกไฟล์ว่าเป็นภาพหรือ PDF
- ลาก If node ตรง Expression: {{$json.mimeType === 'application/pdf'}} ตั้งค่า True = PDF, False = รูป
4. ติดตั้ง Mistral OCR
- ก่อนใช้ต้องสร้าง API Key จากหน้า Mistral OCR แล้วเพิ่มเป็น Credential ใน n8n
✅ กรณี PDF (True branch)
- ต่อ Node: Mistral – Extract Text
- ตั้งค่า Resource: Document, Operation: Extract Text, Model: mistral-ocr-latest, Document Type: Document, Input Type: Binary Data, Input Field: data (ชื่อ binary จากดาวน์โหลด)
✅ กรณี รูป (False branch)
- ต่อ Node: Mistral – Extract Image ตั้งค่าเหมือนกันทุกอย่าง ยกเว้น Document Type = Image
5. ดึงเฉพาะค่าที่อยากเก็บ
- รวมสาย True/False มาที่ Information Extractor
- ช่อง Text ใส่ {{$json.page {0} .markdown}}
- Schema Type: From Attribute Descriptions
ใส่ Attribute ที่ต้องการ เช่น
- total_amount: รวมเงินที่ต้องจ่าย เก็บข้อมูลเป็น number (ตัวเลข)
- address: ที่อยู่บริษัท เก็บข้อมูลเป็น string (ข้อความ)
- bank_details: รายละเอียดธนาคาร เก็บข้อมูลเป็น string (ข้อความ)
✨ Model เลือก OpenAI Chat Model GPT-4.1 mini
6. บันทึกลง Google Sheets
- Node: Google Sheets – Append Row เชื่อม credential
- Document & Sheet กำหนดไฟล์/ชีตที่ต้องการ
- Map คอลัมน์กับค่าจาก Information Extractor (total_amount, address, bank_details)
7. จัดระเบียบไฟล์ให้เรียบร้อย
- Node: Google Drive – Move File ต่อท้าย, Operation = Move
- File = {{$ {' Google Drive Trigger'} .item.json.id}}
- Parent Drive = My Drive ไดร์ฟของตัวเอง ป้องกันไฟล์หาย หาง่าย
- Parent Folder = Processed (หรือชื่ออื่นตามใจ)
ทดสอบ ด้วยการอัป PDF หรือภาพใบเสร็จเข้าโฟลเดอร์ OCR Files รอ 1 นาที (ตามค่าพอล) หรือกด Execute Workflow manual จากนั้นตรวจ Google Sheets เห็นแถวใหม่ + โฟลเดอร์ Processed มีไฟล์ถูกย้าย = จบ!
👉 แค่นี้ก็ได้สายพานอัตโนมัติอ่านใบเสร็จ/เอกสาร แล้วเก็บข้อมูลสำคัญเข้า Sheet แบบไม่ต้องแตะมืออีกเลยครับ
…..
💛 ติดตามเพจเราไว้ เพื่อรับความรู้สาระดี ๆ แบบนี้ได้ประจำครับ