ETL Pipeline คืออะไร
การมีข้อมูลคุณภาพดี มีความสำคัญมากสำหรับ Data Science Project แต่ข้อมูลมักมาจากหลายแหล่งและอยู่ในรูปแบบที่ไม่เป็นระเบียบ ข้อมูลบางส่วนมาจากฐานข้อมูล ในขณะที่บางส่วนมาจากไฟล์หรือเว็บไซต์ ข้อมูลดิบ (Raw data) เหล่านี้จึงไม่สามารถใช้งานในทันทีได้