data preparation

จัดการกับ Outliers

จัดการกับ Outliers

Garbage in, garbage out. ค่าผิดปกติ (Outliers) จำเป็นต้องถูกจัดการ ก่อนนำข้อมูลไปสร้าง Machine Learning Model ตัวอย่างการจัดการกับค่า Outliers โดยใช้ Python code ดังนี้ import numpy as np import pandas as pd from scipy import stats # ข้อมูลตัวอย่าง
Narut Soontranon
ตัวอย่างการใช้ Standardization vs Normalization

ตัวอย่างการใช้ Standardization vs Normalization

Standardization และ Normalization เป็นเทคนิคที่ใช้ในการทำ Scaling สำหรับข้อมูลที่เป็นตัวเลข (Numerical data) มีวัตถุประสงค์และการใช้งานที่แตกต่างกัน ดังนี้ Standardization * แปลงข้อมูลให้มีค่าเฉลี่ยเป็น 0 และส่วนเบี่ยงเบนมาตรฐานเป็น 1 * ใช้เมื่อ: * Feature มี Scale
Narut Soontranon
Feature Engineering อาวุธลับของ Data Scientist

Feature Engineering อาวุธลับของ Data Scientist

จินตนาการถึงหินก้อนใหญ่จากธรรมชาติ สามารถถูกนำไปแกะสลักสร้างผลงานชิ้นเอกได้ แต่ต้องใช้ทักษะและความรู้ของประติมากรในการเปลี่ยนวัตถุดิบให้กลายเป็นประติกรรมที่น่าทึ่ง ในทำนองเดียวกัน นักวิทยาศาสตร์ข้อมูล ทำงานกับข้อมูลดิบ แต่เพื่อปลดล็อกศักยภาพที่แท้จริง
Narut Soontranon