machine learning

เปิดเผยความลับของ Bias และ Variance

เปิดเผยความลับของ Bias และ Variance

ทำความเข้าใจระหว่าง Bias (อคติ) และ Variance (ความแปรปรวน) ในการพัฒนา Machine Learning Models การทำให้ได้ผลการคาดการณ์ที่แม่นยำ ทั้งในขั้นตอนการพัฒนา (Development) และ การใช้งานจริง (Deployment) ถือเป็นเป้าหมายสำคัญ มี 2 แนวคิดพื้นฐาน เรียกว่า Bias (อคติ) และ Variance (ความแปรปรวน) หากเข้าใจความสัมพั
Narut Soontranon
One-class Classification (Ep 2/2)

One-class Classification (Ep 2/2)

อ่าน Ep 1 ที่นี่ -> https://www.nerd-data.com/one-class-classification-ep1/ 3. Isolation Forest หรือ เขียนย่อว่า iForest เป็น Tree-based Anomaly Detection Algorithm Model สร้างบนพื้นฐานของ Normal Data ในแนวทางที่จะ Isolate Anomalies ซึ่งมีจำนวนน้อนและมีค่าที่แตกต่างไปจากค่า Normal ใน
Narut Soontranon
One-class Classification (Ep 1/2)

One-class Classification (Ep 1/2)

Outliers หรือ Anomalies คือ Data Points ส่วนน้อย ที่ไม่สอดคล้องกับข้อมูลที่มีอยู่ * การระบุค่า Outliers หรือ Anomalies ในข้อมูล เรียกว่า "Anomaly Detection" และ สาขาย่อยของ Machine Learning ที่เน้นไปที่ปัญหานี้ เรียกว่า
Narut Soontranon
Dimensionality Reduction คือ อะไร

Dimensionality Reduction คือ อะไร

เป็นเทคนิคหนึ่งในทาง Data Science และ Machine Learning ที่ใช้ในการลด Input Features ของ Dataset  นิยาม ทำ Dataset ที่มีความซับซ้อนให้ง่ายขึ้น โดยลดจำนวน Features (Dimensions) ลง และมีการสูญเสีย Information น้อยที่สุด เป้าหมาย เพื่อหลีกเลี่ยง Curse of Dimensionality
Narut Soontranon
Parametric vs. Non-parametric ML Algorithms

Parametric vs. Non-parametric ML Algorithms

ใน Blog นี้ จะพูดถึงความแตกต่างระหว่าง Parametric และ Non-parametric Machine Learning (ML) Algorithmในภาพรวมของการทำ Machine Learning Models คือ การพยายามหา Mapping Function ระหว่าง ตัวแปร Input X และ ตัวแปร Output Y y = f(X) Parametric ML Algorithms สมมติฐาน ทำให้กระบวนการเรียนรู้ง่ายขึ้น แต่ก็
Narut Soontranon
Random Forest คือ อะไร

Random Forest คือ อะไร

* ถือเป็น Supervised Machine Learning Algorithm ที่อยู่บนพื้นฐานของ Tree * เป็นการรวมเอา Decision Trees แบบสุ่มหลายๆ ต้น (อาจเป็นหลัก 100 ขึ้นกับ Use cases) จึงมีชื่อว่า Random Forest  * มีวัตถุประสงค์ เพื่อเพิ่มประสิทธิภาพในการทำนาย เรียกวิธีการแบบนี้ว่
Narut Soontranon
SVM คือ อะไร

SVM คือ อะไร

SVM ย่อจาก Support Vector Machine เป็น Machine Learning Algorithm ประเภท Supervised Learning มีเป้าหมาย คือ หา Hyperplane ใน N-dimensional Space โดยที่ N คือ จำนวน Features เพื่อใช้ในการ Classify Data Points  ทำไมถึงใช้ SVM 1. มีประสิทธิภาพใน High-dimensional Space 2. ยังคงมีประสิ
Narut Soontranon