data engineer

จะดึงข้อมูลยังไงดี? Batch, Streaming, Push หรือ Pull

จะดึงข้อมูลยังไงดี? Batch, Streaming, Push หรือ Pull

Data Ingestion คือกระบวนการ “พาข้อมูลจากต้นทาง (Source) เข้าสู่ระบบปลายทาง (Data Platform) เช่น Database, Data Warehouse, Data Lake หรือระบบ Analytics การออกแบบ Ingestion จะคิดจาก 2 เรื่องหลัก * ข้อมูลเข้ามาบ่อยแค่ไหน * ใครเป็นฝ่ายเริ่มส่งข้อมูล 1. Batch Processing แนวคิด:
Narut Soontranon
ETL Pipeline คืออะไร

ETL Pipeline คืออะไร

การมีข้อมูลคุณภาพดี มีความสำคัญมากสำหรับ Data Science Project แต่ข้อมูลมักมาจากหลายแหล่งและอยู่ในรูปแบบที่ไม่เป็นระเบียบ ข้อมูลบางส่วนมาจากฐานข้อมูล ในขณะที่บางส่วนมาจากไฟล์หรือเว็บไซต์ ข้อมูลดิบ (Raw data) เหล่านี้จึงไม่สามารถใช้งานในทันทีได้
Narut Soontranon
DevOps และ DataOps

DevOps และ DataOps

ความหมายและความแตกต่างระหว่าง DevOps และ DataOps DevOps DevOps คือแนวทางปฏิบัติที่รวมการพัฒนาซอฟต์แวร์ (Dev - Development) และการปฏิบัติการด้านไอที (Ops - Operations) เข้าด้วยกัน เป้าหมายหลักของ DevOps คือ 1. การส่งมอบซอฟต์แวร์ที่เร็วขึ้น 2. การปรับปรุงการทำงานร่วมกั
Narut Soontranon