05/04/2025
เคยมีคนถามว่าทำไปทำไมสถานีวัด PM2.5?
ได้ข้อมูลมาแล้วจะเห็นอะไร?
อาจจะเล่าแบบวิชาการหน่อยนะครับ โดยใช้ข้อมูลย้อนไป 2 อาทิตย์
จากผลลัพธ์ของ OLS Regression Results ที่แสดงในภาพ มีการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรอิสระ (`wind_speed`, `temperature`, `humidity`) และตัวแปรตาม (`pm2_5`) ตามนี้
1. Coefficients (coef):
- `wind_speed`: ค่า `coef` เท่ากับ -0.5221 (มีค่าเป็นลบ) หมายความว่า เมื่อความเร็วลม (`wind_speed`) เพิ่มขึ้น 1 หน่วย ค่า PM2.5 จะลดลงโดยเฉลี่ย 0.5221 µg/m³ แสดงถึงความสัมพันธ์เชิงลบระหว่างความเร็วลมและ PM2.5 (ลมช่วยกระจายมลพิษ)
- `temperature`: ค่า `coef` เท่ากับ 1.3211 (มีค่าเป็นบวก) หมายความว่า เมื่ออุณหภูมิ (`temperature`) เพิ่มขึ้น 1 หน่วย ค่า PM2.5 จะเพิ่มขึ้นโดยเฉลี่ย 1.3211 µg/m³ แสดงถึงความสัมพันธ์เชิงบวกระหว่างอุณหภูมิและ PM2.5 (อาจเกิดจากการสะสมของมลพิษในอากาศร้อน)
- `humidity`: ค่า `coef` เท่ากับ 1.6397 (มีค่าเป็นบวก) หมายความว่า เมื่อความชื้น (`humidity`) เพิ่มขึ้น 1 หน่วย ค่า PM2.5 จะเพิ่มขึ้นโดยเฉลี่ย 1.6397 µg/m³ แสดงถึงความสัมพันธ์เชิงบวกระหว่างความชื้นและ PM2.5 (อาจเกิดจากการจับตัวของอนุภาคในอากาศชื้น)
2. P-Values:
- `wind_speed`: ค่า P-value < 0.05 (0.000) แสดงว่าความเร็วลมมีนัยสำคัญทางสถิติต่อค่า PM2.5
- `temperature`: ค่า P-value < 0.05 (0.000) แสดงว่าอุณหภูมิมีนัยสำคัญทางสถิติต่อค่า PM2.5
- `humidity`: ค่า P-value < 0.05 (0.000) แสดงว่าความชื้นมีนัยสำคัญทางสถิติต่อค่า PM2.5
3. R-squared:
- ค่า R-squared = 0.137 หมายความว่า 13.7% ของความแปรปรวนในค่า pm2_5 สามารถอธิบายได้ด้วยตัวแปร wind_speed, temperature, และ humidity ในโมเดลนี้ ส่วนที่เหลือ (86.3%) อาจเกิดจากปัจจัยอื่นที่ไม่ได้รวมอยู่ในโมเดล เช่น แหล่งมลพิษเฉพาะ, สภาพภูมิอากาศ, หรือปัจจัยอื่น ๆ
- Adjusted R-squared = 0.136 ค่า Adjusted R-squared จะปรับค่าของ R-squared ให้เหมาะสมกับจำนวนตัวแปรในโมเดล โดยลดผลกระทบจากการเพิ่มตัวแปรที่ไม่สำคัญ
4. Intercept (const):
- ค่า `const` เท่ากับ -63.1436 หมายความว่า หากตัวแปรอิสระทั้งหมด (`wind_speed`, `temperature`, `humidity`) มีค่าเป็น 0 ค่า PM2.5 จะมีค่าเฉลี่ยประมาณ -63.1436 µg/m³ (ซึ่งในทางปฏิบัติอาจไม่มีความหมายเชิงกายภาพ)
5. Model Significance:
- ค่า Prob (F-statistic) = 0.000 แสดงว่าโมเดลโดยรวมมีนัยสำคัญทางสถิติ
สรุปผลการวิเคราะห์:
1. ตัวแปร `wind_speed`, `temperature`, และ `humidity` มีผลกระทบต่อค่า PM2.5 อย่างมีนัยสำคัญทางสถิติ
2. ความเร็วลม (`wind_speed`) มีความสัมพันธ์เชิงลบกับ PM2.5 (ลมช่วยลดมลพิษ)
3. อุณหภูมิ (`temperature`) และความชื้น (`humidity`) มีความสัมพันธ์เชิงบวกกับ PM2.5 (อาจส่งผลให้มลพิษสะสมในอากาศ)
4. โมเดลสามารถอธิบายความแปรปรวนของค่า PM2.5 ได้ในระดับที่ดี (R-squared = 68.7%)
ข้อสังเกต
- ค่า R-squared ค่อนข้างต่ำ (0.137) แสดงว่าโมเดลนี้ยังไม่สามารถอธิบายความแปรปรวนของค่า PM2.5 ได้ดีนัก อาจต้องเพิ่มตัวแปรอื่น ๆ ที่เกี่ยวข้อง เช่น แหล่งกำเนิดมลพิษ, สภาพภูมิอากาศ, หรือข้อมูลเชิงพื้นที่
- ตัวแปร wind_speed มีผลลดค่า PM2.5 ซึ่งสอดคล้องกับสมมติฐานที่ว่าความเร็วลมช่วยกระจายมลพิษ
- ตัวแปร temperature และ humidity มีผลเพิ่มค่า PM2.5 ซึ่งอาจเกี่ยวข้องกับสภาพอากาศที่เอื้อต่อการสะสมของมลพิษ
ในอนาคตเราคงต้องทำการปรับปรุงโมเดลเพิ่มเติม อาจพิจารณาเพิ่มตัวแปรอื่น ๆ เช่น แหล่งกำเนิดมลพิษ การจราจร หรือข้อมูลภูมิศาสตร์ เข้าไป