AI VIET NAM

AI VIET NAM Cùng học tập, xây dựng và phát triển khoa học dữ liệu và trí tuệ nhân tạo Việt Nam
(12)

Ở hội nghị CITA-2026, các bạn AIO tham gia với 2 paper từ hai nhóm nghiên cứuBài 1 do bạn Việt Anh (AIO-2023, ĐH Công Th...
26/05/2026

Ở hội nghị CITA-2026, các bạn AIO tham gia với 2 paper từ hai nhóm nghiên cứu

Bài 1 do bạn Việt Anh (AIO-2023, ĐH Công Thương) làm first author và được hướng dẫn bởi cô Quỳnh Trang.

Bài 2 do bạn Võ Hoàng (AIO-2025, ĐH Khoa Học Tự Nhiên HCM) làm first author và được hướng dẫn bởi thầy Quốc Thái.

Ad xin chúc mừng các bạn AIO và cám ơn các mentor!

--------------

𝘾𝙝𝙪̛𝙤̛𝙣𝙜 𝙩𝙧𝙞̀𝙣𝙝 𝙝𝙤̛̣𝙥 𝙩𝙖́𝙘 𝙣𝙜𝙝𝙞𝙚̂𝙣 𝙘𝙪̛́𝙪

Các thầy cô ở các trường nếu cần tuyển thành viên nghiên cứu (để ra paper và không làm project kiếm tiền) thì có thể đặt hàng ad và đưa ra yêu cầu chất lượng đầu vào, ad sẽ đạo tạo thêm và giới thiệu các bạn đủ tiêu chuẩn đến các thầy cô đúng hạn.

Mọi thứ free và win-win-win ba bên (thầy cô có nguồn nhân lực nghiên cứu tốt; các bạn giỏi có mentor làm nghiên cứu cùng; và AIVN được ghi nhận khi kết nối thành công và khi có kết quả nghiên cứu)

Các thầy cô muốn trao đổi thêm thì nhắn mình (Quang Vinh) qua SĐT/Zalo: 091 111 9228

Bài giảng về Vibe Coding dùng Claude CodeAd để link dưới comment.
25/05/2026

Bài giảng về Vibe Coding dùng Claude Code

Ad để link dưới comment.

Buổi học về Vibe Coding. Buổi này hữu ích cho hầu hết các bạn làm liên quan đến code nên ad share buổi học này.Buổi học ...
24/05/2026

Buổi học về Vibe Coding.

Buổi này hữu ích cho hầu hết các bạn làm liên quan đến code nên ad share buổi học này.

Buổi học qua Zoom và học từ 8:00 tối nay (24/05/2026). Các bạn tham gia học Zoom ID này: 946 7653 0646

Các bạn vào từ 7:50 được. Đây là slide của buổi học https://drive.google.com/file/d/1E54ugbhIb_bDvoT6WSbu1o9RytHk3q6X/view?usp=sharing

Huấn luyện bổ sung Large Vision-Language Model cho bài toán object detection và visual question answering Large vision-l...
24/05/2026

Huấn luyện bổ sung Large Vision-Language Model cho bài toán object detection và visual question answering

Large vision-language model (LVLM) là một dạng mô hình deep learning được thiết kế để xử lý và hiểu đồng thời cả dữ liệu thị giác lẫn ngôn ngữ tự nhiên trong cùng một hệ thống thốngnhất.

Kế thừa nền tảng từ các mô hình ngôn ngữ lớn (LLM) và bổ sung thêm năng lực nhận biết hình ảnh, LVLM có thể thực hiện đa dạng các tác vụ vốn đòi hỏi sự kết hợp giữa hai phương thức dữ liệu, từ mô tả nội dung ảnh, trả lời câu hỏi dựa trên hình ảnh, cho tới nhận diện đối tượng theo mô tả bằng ngôn ngữ.

Sự ra đời của LVLM không chỉ mở rộng phạm vi ứng dụng củaAI mà còn được xem là một bước tiến quan trọng trên hành trình hướng tới artificial general intelligence (AGI), nơi các hệ thống có thể tiếp cận và xử lý thông tin một cách linh hoạt như con người.

khi áp dụng vào các tác vụ có nội dung nằm ngoài phạm vi của bộ dữ liệu gốc, LVLM thường không đạt được độ chính xác như mong muốn do thiếu kiến thức về ngữ cảnh và các khái niệm đặc thù trong miền dữ liệu mới.

Một hướng tiếp cận phổ biến để khắc phục hạn chế này là supervised fine-tuning (SFT), một kỹ thuật tinh chỉnh mô hình có giám sát trên bộ dữ liệu thuộc tác vụ đích nhằm giúp mô hình thích nghi tốt hơn với ngữ cảnh mới.

Trong bài viết này, hai bài toán object detection và visual question answering sẽ được chọn làm ví dụ minh họa cho quy trình SFT trên một mô hình LVLM cụ thể.

Các bạn có thể đọc online ở đây https://tutorial.aivietnam.edu.vn/pdf/63

Xây dựng Hệ thống gợi ý (Recommender system)Recommender system được phát triển để hỗ trợ bài toán đó bằng cách khai thác...
23/05/2026

Xây dựng Hệ thống gợi ý (Recommender system)

Recommender system được phát triển để hỗ trợ bài toán đó bằng cách khai thác dữ liệu về user, item và hành vi tương tác, từ đó cá nhân hóa trải nghiệm, giảm gánh nặng lựa chọn và cải thiện hiệu quả phân phối nội dung trên nền tảng.

Thời gian tìm kiếm sản phẩm của người dùng được giảm thiểu, qua đó hạn chế tình trạng quá tải thông tin. Đồng thời, hệ thống cũng góp phần duy trì mức độ tương tác và gia tăng doanh thu cho các nền tảngtrực tuyến.

Bài viết giới thiệu các hệ thống recommender tiêu biểu và thảo luận chi tiết phương pháp Collaborative Filtering. Sau cùng là bài project ứng dụng trên dữ liệu video MicroLens.

Các bạn có thể đọc online ở đây https://tutorial.aivietnam.edu.vn/pdf/62

22/05/2026

Demo: Xây dựng agent điểu khiển máy tính (~OpenClaw)

AI giải được bài toán khó từ năm 1946Trong nhiều năm, không ít nhà toán học đã cố gắng giải bài toán này và kết quả đạt ...
22/05/2026

AI giải được bài toán khó từ năm 1946

Trong nhiều năm, không ít nhà toán học đã cố gắng giải bài toán này và kết quả đạt được chưa tối ưu. OpenAI hôm 20/5 công bố AI nội bộ đã tìm ra cách giải mới và có kết quả tốt hơn.

Các bạn đọc thêm bài báo để dưới comment.

Hướng dẫn xây dựng Vision-Language ModelTrong vài năm gần đây, large language model (LLM) đã chứng minh khả năng ấn tượn...
21/05/2026

Hướng dẫn xây dựng Vision-Language Model

Trong vài năm gần đây, large language model (LLM) đã chứng minh khả năng ấn tượng trong việc hiểu chỉ dẫn, suy luận và sinh văn bản tự nhiên. Tuy nhiên, thế giới thực không chỉ gồm văn bản, và đây là giới hạn mà LLM thuần văn bản không thể vượt qua.

Điều này thúc đẩy hướngnghiên cứu mở rộng LLM sang khả năng hiểu ảnh, từ đó hình thành large vision-language model (LVLM), cho phép thực hiện các tác vụ như mô tả ảnh, hỏi đáp và hội thoại đa lượt có ảnh.

Trong bài viết này, chúng ta sẽ tìm hiểu cách xây dựng một LVLM tiếng Việt thông qua bước quan trọng đầu tiên là pre-training. Quy trình huấn luyện gồm hai giai đoạn, trong đó giai đoạn đầu căn chỉnh projector bằng dữ liệu image captioning, sau đó fine-tune mô hình bằng dữ liệu visual instruction tuning để học cách phản hồi theo instruction bằng tiếng Việt.

Các bạn có thể đọc online ở đây https://tutorial.aivietnam.edu.vn/pdf/61

Ở tuyển sinh đợt 2 cho chương trình AI Thực Chiến, lớp AIO có ít nhất 8 bạn vượt qua vòng thi và chuẩn bị đợt nhập học t...
20/05/2026

Ở tuyển sinh đợt 2 cho chương trình AI Thực Chiến, lớp AIO có ít nhất 8 bạn vượt qua vòng thi và chuẩn bị đợt nhập học trong thời gian tới.

Chúc mừng các bạn!

Agentic RAGRetrieval-Augmented Generation (RAG) là một hướng tiếp cận giúp mô hình ngôn ngữ lớn khai thác tri thức bên n...
20/05/2026

Agentic RAG

Retrieval-Augmented Generation (RAG) là một hướng tiếp cận giúp mô hình ngôn ngữ lớn khai thác tri thức bên ngoài để tạo câu trả lời chính xác hơn.

Trong RAG truyền thống, hệ thống thường hoạt động theo một pipeline cố định: nhận câu hỏi, truy xuất ngữ cảnh, đưa ngữ cảnh vào large language model (LLM), rồi sinh câu trả lời. Cách làm này phù hợp với các câu hỏi đơn giản.

Tuy nhiên, khi câu hỏi cần nhiều bước suy luận, cần đổi chiến lược truy xuất hoặc cần kiểm tra lại chất lượng ngữ cảnh, pipeline cố định bắt đầu trở nên kém linh hoạt.

Bài học này giới thiệu Agentic RAG trên nền tảng LangGraph và Deep Agents. Thông qua project hỏi đáp pháp luật tiếng Việt, người học sẽ thấy cách hệ thống lựa chọn chiến lược retrieval phù hợp, truy xuất ngữ cảnh và sinh câu trả lời có dẫn nguồn.

Các bạn có thể đọc online ở đây https://tutorial.aivietnam.edu.vn/pdf/60

Bài đọc 74 trang về Vibe Coding dùng Claude CodeNgày nay, mô hình ngôn ngữ lớn (LLM) đã thay đổi căn bản cách lập trình ...
19/05/2026

Bài đọc 74 trang về Vibe Coding dùng Claude Code

Ngày nay, mô hình ngôn ngữ lớn (LLM) đã thay đổi căn bản cách lập trình viên làm việc. Thay vì gõ từng dòng, chúng ta giờ đây có thể mô tả ý định bằng ngôn ngữ tự nhiên và để AI agent đề xuất diff (tức là AI đề xuất việc thay đổi code dưới dạng + dòng thêm / - dòng xoá để lập trình viên kiểm duyệt trước khi chỉnh sửa), gọi tool, chạy test, và đề xuất commit message.

Andrej Karpathy gọi pattern làm việc này là vibe coding: “you fully give in to the vibes... see stuff, say stuff, run stuff, copy paste stuff”. Khái niệm này tóm gọn một thay đổi: từ viết code sang điều khiển agent viết code.

Trong phần nội dung này, chúng ta sẽ tìm hiểu toàn bộ pipeline vibe coding với Claude Code –một CLI agent loop chuyên dụng của Anthropic:

1) Claude Code: agent loop trên terminal, có sẵn các tool Read/Write/Edit/Bash/Grep, hỗ trợ MCP, Subagent, Skill, Hook, Slash Command.

2) Workflow E→P→C→C: bốn bước chuẩn cho mọi quy trình vibe coding – Explore, Plan, Code, Commit.

3) Context Engineering: quản lý context window hiệu quả.

4) ReAct Agent Project: xây dựng một ReAct Agent từ đầu bằng quy trình vibe coding (Lab 1), sau đó nâng cấp với 4 cơ chế mở rộng (Lab 2).

Sau đó chúng ta sẽ triển khai ReAct Agent thông qua OpenAI Function Calling và httpx (choTavily REST API), đồng thời sử dụng Claude Code làm môi trường vibe coding.

Các bạn có thể đọc online ở đây
https://tutorial.aivietnam.edu.vn/pdf/59

File PDF
https://drive.google.com/file/d/1UgNaikBfok2CQO8Fv46FgZcDUyXTO_Yz/view?usp=sharing

Address

Phan Rang- Thap Cham
660000

Alerts

Be the first to know and let us send you an email when AI VIET NAM posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Contact The Business

Send a message to AI VIET NAM:

Share