Data Analytics Hub

Data Analytics Hub Chia sẻ kiến thức về Business Analytics, Operational Research (Vận trù học) và Data Science
(1)

👋 Xin chào các độc giả của Data Analytics Hub (DAH)!🎬 Năm 2021 sắp kết thúc, chúng ta sẽ có những giây phút nghỉ ngơi sa...
30/12/2021

👋 Xin chào các độc giả của Data Analytics Hub (DAH)!

🎬 Năm 2021 sắp kết thúc, chúng ta sẽ có những giây phút nghỉ ngơi sau một năm đầy biến động. Cùng chung với không khí này, bài viết cuối cùng của page trong năm nay sẽ không đề cập đến những kiến thức khiến các bạn phải động não nữa, mà đơn thuần chỉ là giải trí. Đội ngũ của DAH xin gửi tới các bạn danh sách 4 bộ phim liên quan đến chủ đề phân tích dữ liệu, machine learning, AI,… như một lựa chọn để các bạn có thể tham khảo cho những ngày nghỉ sắp tới.

🎥 Nội dung của những bộ phim này, tất nhiên không phải là sự diễn giải của những phương pháp hay thuật toán, mà chúng tập trung vào việc truyền cảm hứng, để ở góc độ nào đó người xem có thể cảm thấy thích thú với khoa học dữ liệu trong cuộc sống. Những bộ phim mà page lựa chọn đều là những tác phẩm được đánh giá cao bởi cả khán giả đại chúng lẫn giới chuyên môn.

💗 Cảm ơn các bạn đã ủng hộ page trong suốt thời gian qua. Chúc các bạn một năm mới nhiều niềm vui và thành công! Hẹn gặp lại các bạn với những kiến thức mới cùng các bài viết chất lượng hơn nữa trong năm 2022 nhé! ️🎉
-----
⚙ Data Analytics Hub
📬 Email: [email protected]
📩 Tư vấn trực tiếp: m.me/DataAnalyticsHubVN

💥 HỌC R CƠ BẢN – PHẦN 5▶️ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VỚI R (Tiếp)🔹 Tiếp nối nội dung của tuần trước, chủ đề của bài v...
21/12/2021

💥 HỌC R CƠ BẢN – PHẦN 5

▶️ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VỚI R (Tiếp)

🔹 Tiếp nối nội dung của tuần trước, chủ đề của bài viết ngày hôm nay vẫn là về … kiểm định giả thuyết thống kê (Hypothesis Testing).

Như các bạn đã biết thì có rất nhiều loại kiểm định khác nhau, ứng với sự đa dạng về mục tiêu và số liệu thống kê. Nếu như ở bài trước, page đã hướng dẫn cách kiểm định trung bình của một tổng thể với R, thì bài viết này sẽ đề cập đến một loại test khác cũng khá phổ biến – kiểm định về tỷ lệ.

🔹 Bạn muốn kiểm định tỷ lệ người mua hài lòng với dịch vụ của doanh nghiệp nhưng không thể điều tra toàn bộ về khách hàng? Bài viết này có thể hữu ích cho bạn đấy!

-----
Nội dung liên quan:
▶️ Phần 1 - Làm quen với R: https://bit.ly/3mpjRKt
▶️ Phần 2 - Phân tích dữ liệu cơ bản với R: https://bit.ly/2ZZR2fn
▶️ Phần 3 - Linear Regression với R: https://bit.ly/3oL1D7d
▶️ Phần 4 - Hypothesis Testing với R: https://bit.ly/3e8TzXV
-----
⚙ Data Analytics Hub
📬 Email: [email protected]
📩 Tư vấn trực tiếp: m.me/DataAnalyticsHubVN

️🎯 HỌC R CƠ BẢN – PHẦN 4▶️ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (HYPOTHESIS TESTING) VỚI RXin chào các bạn! Hôm nay chúng ta lạ...
13/12/2021

️🎯 HỌC R CƠ BẢN – PHẦN 4

▶️ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (HYPOTHESIS TESTING) VỚI R

Xin chào các bạn! Hôm nay chúng ta lại tiếp tục với series phân tích dữ liệu cơ bản với R nhé.

💠 Chủ đề của bài viết này là về kiểm đinh giả thuyết thống kê (GTTK), hay Hypothesis Testing. Kiểm định giả thuyết thống kê là một trong những phương pháp quan trọng của Thống kê suy luận (Statistical Inference), nhằm đưa ra kết luận về tập hợp dữ liệu, dựa vào một mẫu dữ liệu nhỏ hơn lấy từ tập hợp đó.

Nói cách khác, trong nhiều trường hợp trên thực tế, chúng ta không thể có được dữ liệu về toàn bộ tổng thể. Vì vậy, để đưa ra kết luận về một đặc điểm thống kê nào đó của một hay nhiều tổng thể (như giá trị trung bình, tỷ lệ, kiểu phân phối, …), chúng ta tiến hành chọn mẫu rồi thực hiện phân tích trên mẫu đó. Kiểm định GTTK là một trong những kỹ thuật giúp ta đưa ra những phân tích như vậy. Tùy vào mục đích cũng như đặc điểm của dữ liệu, mà có nhiều loại kiểm định khác nhau (Z-test, t-test, F-test, chi-bình phương, …)

💠 Mục đích chính của bài viết hôm nay là minh họa cách thực hiện một loại kiểm định GTTK cơ bản (t-test) với R. Nếu bạn đọc chưa quen với các khái niệm thuộc chủ đề này, như giả thuyết không, miền bác bỏ, p-value, … , thì có thể tham khảo các tài liệu từ các nguồn khác nhé.

-----
Nội dung liên quan:
▶️ Introduction to R - Phần 1: https://bit.ly/3mpjRKt
▶️ Introduction to R - Phần 2: https://bit.ly/3EUmYRq
▶️ Introduction to R - Phần 3: https://bit.ly/3DQfEFh
▶️ Phân tích dữ liệu cơ bản với R: https://bit.ly/2ZZR2fn
▶️ Linear Regression với R: https://bit.ly/3oL1D7d
-----
⚙ Data Analytics Hub
📬 Email: [email protected]
📩 Tư vấn trực tiếp: m.me/DataAnalyticsHubVN

🔥 HỌC R CƠ BẢN – PHẦN 3LINEAR REGRESSION (HỒI QUY TUYẾN TÍNH) ĐƠN GIẢN VỚI R🔻 Các bạn học Kinh tế lượng hẳn không còn xa...
08/11/2021

🔥 HỌC R CƠ BẢN – PHẦN 3

LINEAR REGRESSION (HỒI QUY TUYẾN TÍNH) ĐƠN GIẢN VỚI R

🔻 Các bạn học Kinh tế lượng hẳn không còn xa lạ gì với Hồi quy tuyến tính. Đây là một chủ đề vô cùng quen thuộc trong Statistics, và thường là thuật toán đầu tiên bạn được học khi tìm hiểu về Machine Learning. Linear Regression, hiểu một cách đơn giản, là một phương pháp giúp phân tích mối quan hệ giữa một biến (biến phụ thuộc) với nhiều biến khác (biến phụ thuộc).

🔻 Hôm nay page sẽ giới thiệu cách thực hiện kỹ thuật này với R. Thực ra thì đằng sau một mô hình hồi quy tuyến tính có rất nhiều giả định (assumption). Bài viết này sẽ không đi sâu vào những phân tích phức tạp đó, mà chỉ dừng lại ở việc thực hiện các phép hồi quy cơ bản cũng như cách đọc kết quả trong R.

👇 Nào, hãy cùng tiếp tục với eries ứng dụng này của page nhé!
-----
Nội dung liên quan:
▶️ Introduction to R - Phần 1: https://bit.ly/3mpjRKt
▶️ Introduction to R - Phần 2: https://bit.ly/3EUmYRq
▶️ Phân tích dữ liệu cơ bản với R: https://bit.ly/2ZZR2fn
-----
⚙ Data Analytics Hub
📬 Email: [email protected]
📩 Tư vấn trực tiếp: m.me/DataAnalyticsHubVN

📌 HỌC R CƠ BẢN – PHẦN 2PHÂN TÍCH DỮ LIỆU ĐƠN GIẢN VỚI RỞ bài viết này, các bạn hãy cùng Page thực hiện một vài phân tích...
29/10/2021

📌 HỌC R CƠ BẢN – PHẦN 2

PHÂN TÍCH DỮ LIỆU ĐƠN GIẢN VỚI R

Ở bài viết này, các bạn hãy cùng Page thực hiện một vài phân tích đơn giản với một bộ dữ liệu (data set) có sẵn bằng ngôn ngữ R nhé. Mục đích chính là giúp bạn làm quen với cách load bộ dữ liệu vào R, tính toán các chỉ số cơ bản cũng như vẽ một số đồ thị để mô tả một cách tổng quan bộ dữ liệu!
-----

Nội dung liên quan:
▶️ Introduction to R - Phần 1: https://bit.ly/3mpjRKt
-----

📖 Tham khảo: James, G., Witten, D., Hastie, T., Tibshirani, R., 2021. An Introduction to Statistical Learning: with Applications in R, Springer Texts in Statistics. Springer-Verlag, New York.
-----

⚙ Data Analytics Hub
📬 Email: [email protected]
📩 Tư vấn trực tiếp: m.me/DataAnalyticsHubVN

💥 HỌC R CƠ BẢN – PHẦN 1R là một công cụ/ngôn ngữ rất hiệu quả trong phân tích dữ liệu, trực quan hóa, cũng như chạy các ...
25/10/2021

💥 HỌC R CƠ BẢN – PHẦN 1

R là một công cụ/ngôn ngữ rất hiệu quả trong phân tích dữ liệu, trực quan hóa, cũng như chạy các thuật toán Machine Learning. Đặc biệt R được sử dụng phổ biến trong thống kê, nó mang đầy đủ những tính năng của các phần mềm thương mại nổi tiếng khác như SPSS, STATA hay EViews. Ưu điểm của R là miễn phí, linh hoạt, rõ ràng, dễ cài đặt và có một cộng đồng người dùng cực kỳ lớn.

Chính vì vậy, hôm nay Page xin giới thiệu với các bạn muốn làm quen với ngôn ngữ này cách để cài đặt, cũng như chạy một số câu lệnh phân tích cơ bản trong R.

👇 Nào hãy cùng học với Page nhé!
-----
⚙ Data Analytics Hub
📬 Email: [email protected]
📩 Tư vấn trực tiếp: m.me/DataAnalyticsHubVN

📑 [CHIA SẺ TÀI LIỆU] MỘT SỐ CHEATSHEET DÀNH CHO NGÔN NGỮ R💥 Các bạn tìm hiểu về dữ liệu, nhất là mảng xác suất thống kê ...
18/10/2021

📑 [CHIA SẺ TÀI LIỆU] MỘT SỐ CHEATSHEET DÀNH CHO NGÔN NGỮ R

💥 Các bạn tìm hiểu về dữ liệu, nhất là mảng xác suất thống kê hẳn đã biết đến R. Đây là một trong những ngôn ngữ phổ biến nhất được sử dụng trong thống kê, phân tích và trực quan hóa dữ liệu. R cũng là công cụ khá mạnh để chạy các thuật toán học máy (Machine Learning), với các thư viện được phát triển liên tục nhằm đơn giản hóa các tác vụ về khoa học dữ liệu.

RStudio là một môi trường phát triển tích hợp (IDE) cho R và được sử dụng rất phổ biến Thực chất có thể coi cả R và RStudio đều là những phiên bản khác nhau của cùng một thứ. RStudio cho phép truy cập trực tiếp và lập trình bằng ngôn ngữ R, cũng như hỗ trợ rất nhiều tính năng nâng cao, giúp cho việc quản lý và phân tích dữ liệu với R được hiệu quả hơn.

💥 Cũng giống như các ngôn ngữ lập trình khác, R có rất nhiều cú pháp (syntax), phục vụ cho những mục đích khác nhau. Một trong những cách học các câu lệnh và cú pháp nhanh nhất chính là qua các cheatsheets. Chính vì vậy, hôm nay page xin chia sẻ với các bạn “kho” cheatsheet của R, nhằm giúp các bạn tiếp cận với ngôn ngữ này dễ dàng hơn.

👉 Các bạn hãy khám phá tại đây nhé https://www.rstudio.com/resources/cheatsheets/

Còn nếu các bạn chưa có trải nghiệm với R và muốn tìm hiểu về R, page sẽ có một số bài viết hướng dẫn cơ bản trong thời gian tới nhé!

-----
⚙ Data Analytics Hub
📬 Email: [email protected]
📩 Tư vấn trực tiếp: m.me/DataAnalyticsHubVN

📝 [CHIA SẺ TÀI LIỆU] MẠNG NƠ-RON NHÂN TẠO🔥 Chủ đề hôm nay của page là về Phân tích dự đoán (Predictive Analytics), mà cụ...
11/10/2021

📝 [CHIA SẺ TÀI LIỆU] MẠNG NƠ-RON NHÂN TẠO

🔥 Chủ đề hôm nay của page là về Phân tích dự đoán (Predictive Analytics), mà cụ thể hơn là về Deep Learning – một lĩnh vực nghiên cứu vô cùng hấp dẫn trong những năm gần đây. Tài liệu được chia sẻ trong bài viết này đề cập đên nền tảng của Deep Learning, chính là Neural Networks.

Neural Networks hay còn gọi là Mạng nơ-ron nhân tạo là mạng sử dụng các mô hình toán học phức tạp để xử lý thông tin, “bắt chước” cách hoạt động của bộ não con người, cho phép các chương trình máy tính nhận ra những mối quan hệ trong dữ liệu và giải quyết các vấn đề phổ biến trong AI, đặc biệt là các bài toán dự đoán (phân loại khách hàng, phân tích ngôn ngữ, nhận diện hình ảnh, âm thanh, v.v.).

Nếu bạn muốn hoặc mới bắt đầu tìm hiểu về Neural Networks cũng như Deep Learning thì có thể theo dõi loạt video dưới đây, với những kiến thức khá cơ bản về thuật toán này cùng ứng dụng của nó trong việc phân loại hình ảnh.

🔥 Loạt bài giảng này đến từ kênh Youtube Statquest của tác giả Josh Starmer, mà page đã từng giới thiệu trước đây. Điểm nổi bật của kênh này là cách tiếp cận vấn đề khá vui vẻ, nhưng không làm mất đi sự căn bản và độ sâu của kiến thức. Chính vì vậy mà một chủ đề tương đối khó nhằn như Neural Networks cũng trở nên khá dễ hiểu và gần gũi.

👉 Hãy cùng tìm hiểu cách máy móc mô phỏng lại hành vi của não người tại đây nhé: https://bit.ly/3oTbsR4
-----
⚙ Data Analytics Hub
📬 Email: [email protected]
📩 Tư vấn trực tiếp: m.me/DataAnalyticsHubVN

🤝🤝 AMAZON & MIT HỢP TÁC GIẢI QUYẾT BÀI TOÁN TỐI ƯU HÓA TUYẾN ĐƯỜNG💥 Hôm nay page xin chia sẻ với các bạn một bài viết tr...
07/10/2021

🤝🤝 AMAZON & MIT HỢP TÁC GIẢI QUYẾT BÀI TOÁN TỐI ƯU HÓA TUYẾN ĐƯỜNG

💥 Hôm nay page xin chia sẻ với các bạn một bài viết trên blog của Amazon về việc hồi đầu năm nay, “ông lớn” ngành bán lẻ này đã từng bắt tay với Viện Công nghệ Massachusetts phát động một cuộc thi nhằm cải thiện bài toán người giao hàng (TSP), mà page đã giới thiệu trong thời gian qua.

Qua bài viết này, các bạn có thể hiểu thêm được vai trò quan trọng của bài toán người giao hàng – Travelling Salesman Problem, nhất là đối với những doanh nghiệp hoạt động trong lĩnh vực cung ứng, logistics và vận tải như Amazon.

💥 Cụ thể, bộ phận hậu cần của Amazon có nhiệm vụ phát triển các phần mềm nhằm tìm ra được tuyến đường vận chuyển hiệu quả nhất cho các tài xế, dựa vào dữ liệu về các địa điểm giao hàng. Tuy vậy, mặc dù các tuyến đường đã được lên kế hoạch sẵn, nhưng trong thực tế, nhiều khi các tài xế lại không thực hiện đúng như những gì đã đề ra. Có khá nhiều nguyên nhân cho tình trạng này, ví dụ như tắc đường, tai nạn giao thông, vấn đề về chỗ đỗ xe, … Việc điều hướng sang một lộ trình khác có thể ảnh hưởng tới chi phí vận tải của Amazon, cũng như thời gian giao hàng, chất lượng dịch vụ và trải nghiệm người dùng.

Chính vì vậy, tháng 2/2021, Amazon và MIT đã đồng tài trợ cho một cuộc thi mang tên “Amazon Last Mile Routing Research Challenge”, chủ yếu dành cho giới học thuật, nhằm tìm ra thêm thông tin mang tính real-time cho bài toán TSP. Amazon cung cấp gần 10,000 bản ghi dữ liệu quá khứ về lộ trình thực tế của tài xế từ 5 khu vực tại Mỹ, yêu cầu các đội thi xây dựng những mô hình Machine Learning có thể dự đoán được việc điều hướng của tài xế.

🎁 Tổng giải thưởng của cuộc thi lên tới 175 nghìn USD. Trong cùng link chi sẻ bên dưới, các bạn có thể thấy thêm một bài viết khác về kết quả của cuộc thi vào tháng 8/2021. Trong đó, giải nhất với giá trị 100 nghìn USD đã được trao cho bộ 3 giáo sư – phó giáo sư đến từ Canada, Đức và Đan Mạch.

===

👇 Như các bạn đã theo dõi thì page có kha khá bài viết về TSP cùng một số cách giải cơ bản. Cùng tìm hiểu xem vấn đề này đang phát triển như thế nào tại các công ty lớn trong thực tế nhé!

https://www.amazon.science/blog/amazon-mit-team-up-to-add-driver-know-how-to-delivery-routing-models

----
⚙ Data Analytics Hub
📬 Email: [email protected]
📩 Tư vấn trực tiếp: m.me/DataAnalyticsHubVN

In a new competition, research teams will train machine learning models to factor in drivers’ deviations from computed routes.

️🎉 VẤN ĐỀ HOẠCH ĐỊNH TUYẾN ĐƯỜNG▶️ VEHICLE ROUTING PROBLEM⚡ Thời gian gần đây, page có một số bài viết xoay quanh bài to...
04/10/2021

️🎉 VẤN ĐỀ HOẠCH ĐỊNH TUYẾN ĐƯỜNG

▶️ VEHICLE ROUTING PROBLEM

⚡ Thời gian gần đây, page có một số bài viết xoay quanh bài toán Travelling Salesman Problem (TSP), với nội dung tìm MỘT tuyến đường ngắn nhất đi qua tất cả các địa điểm cho trước. Tuy nhiên, có những trường hợp chúng ta không thể đi đến hết các điểm trong MỘT lộ trình như thế. Chẳng hạn như một nhà máy dùng xe tải để giao sản phẩm đến các khách hàng, nhưng mỗi xe chỉ có một tải trọng nhất định nên cần phải có một đội xe để thực hiện các lộ trình khác nhau đến các khách hàng.

Trường hợp này chúng ta giải quyết như thế nào❓

⚡ Đó là nội dung của Vấn đề hoạch định tuyến đường – Vehicle Routing Problem (VRP). Cũng giống như TSP, Vehicle Routing Problem có ý nghĩa đặc biệt quan trọng trong chuỗi cung ứng, logistics và vận tải, giúp giảm chi phí, tiết kiệm thời gian cũng như nâng cao hiệu suất của đội xe.

👇 Hãy cùng tìm hiểu sơ bộ về chủ đề này trong bài viết dưới đây nhé!

----
Nội dung liên quan:
▶️ Travelling Salesman Problem: https://bit.ly/3knSVbD

----
⚙ Data Analytics Hub
📬 Email: [email protected]
📩 Tư vấn trực tiếp: m.me/DataAnalyticsHubVN

👌 GIẢI BÀI TOÁN TÌM ĐƯỜNG NGẮN NHẤT (PHẦN 7)👉 TỔNG HỢP CÁC CÁCH PHỔ BIẾN CẢI THIỆN MỘT LỘ TRÌNH SẴN CÓĐứng trước một lộ ...
30/09/2021

👌 GIẢI BÀI TOÁN TÌM ĐƯỜNG NGẮN NHẤT (PHẦN 7)

👉 TỔNG HỢP CÁC CÁCH PHỔ BIẾN CẢI THIỆN MỘT LỘ TRÌNH SẴN CÓ

Đứng trước một lộ trình có sẵn đi qua tất cả các điểm, có những cách biến đổi nào để có thể rút ngắn được tổng độ dài quãng đường??

Như đã đề cập ở bài trước, một trong những cách thức đó là 2-opt: bỏ 2 cạnh trong lộ trình và thay bằng 2 cạnh mới có tổng độ dài ngắn hơn. Tiếp tục ý tưởng đó, bài viết hôm nay của page sẽ giới thiệu với các bạn một số cơ chế khác tương tự với 2-opt, đó là 3-opt, Or-opt, Relocation (hay còn gọi là Shift) và Exchange (còn có tên là Swap).

👇 Hãy cùng tìm hiểu nội dung của từng cách thức nhé!
----
Nội dung liên quan:

▶️ Giới thiệu về TSP: https://bit.ly/3knSVbD
▶️ Tổng quan về Heuristics: https://bit.ly/3Bop0qJ
▶️ Giải TSP bằng Greedy Algorithm: https://bit.ly/2WGRJbi
▶️ Giải TSP bằng Insertion Procedure: https://bit.ly/3ngC1yK
▶️ Giải TSP bằng Clarke & Wright: https://bit.ly/3zpxVXs
----
⚙ Data Analytics Hub
📬 Email: [email protected]
📩 Tư vấn trực tiếp: m.me/DataAnalyticsHubVN

Address

Hanoi

Alerts

Be the first to know and let us send you an email when Data Analytics Hub posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Contact The Business

Send a message to Data Analytics Hub:

Share