The Shape of Learning: Parametric vs Non-Parametric
Parametric vs Non-parametric Model ใน Machine Learning สามารถแบ่งแยกความแตกต่างได้ ดังนี้
Parametric Model
- เป็นการเลือกรูปแบบเฉพาะ เช่น สมการเส้นตรง (Linear) สำหรับ Linear Regression Model
- ในการ Train Model จะพยายามหา Coefficients (ค่า a และ b) ของสมการ
y = aX + b
ข้อดี
- ง่าย
- รวดเร็ว
- ใช้ข้อมูลในการ Train Model จำนวนน้อยกว่า
ข้อเสีย
- มีข้อจำกัดตามรูปแบบที่เลือกใช้ เช่น เส้นตรง
- ทำงานกับปัญหาที่ซับซ้อนมากไม่ได้
- สามารถ Fit กับ data ได้ไม่ดีเท่าแบบ Non-parametric
ตัวอย่าง Algorithms: Linear / Polynomial Regression, Logistic Regression, Linear Discriminant Analysis, Perceptron
Non-parametric Model
การ Train Model จะไม่ได้กำหนดรูปแบบเฉพาะ (หรือสมการ) แต่จะกำหนดระดับความซับซ้อนของ Model แทน เช่น Decision Tree กำหนดความลึกของ Tree จำนวน Lead Nodes เป็นต้น
ข้อดี
- ทำงานกับปัญหาที่ซับซ้อนได้ดีกว่า
- Fit กับ Data ได้ดีกว่า
- มีความยืดหยุ่น
ข้อเสีย
- ใช้ข้อมูลจำนวนมาก
- มีโอกาสเกิด Overfitting
- ช้ากว่า
ตัวอย่าง Algorithms: Decision Tree, Naïve Bayes, Neural Networks