เมื่อฉันกำลังอ่านเกี่ยวกับการใช้StandardScaler
คำแนะนำส่วนใหญ่บอกว่าคุณควรใช้StandardScaler
ก่อนที่จะแยกข้อมูลออกเป็นรถไฟ / ทดสอบ แต่เมื่อฉันตรวจสอบบางส่วนของรหัสโพสต์ออนไลน์ (โดยใช้ sklearn) มีการใช้หลักสองประการ
1- ใช้StandardScaler
กับข้อมูลทั้งหมด เช่น
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_fit = sc.fit(X)
X_std = X_fit.transform(X)
หรือ
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X = sc.fit(X)
X = sc.transform(X)
หรือเพียงแค่
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_std = sc.fit_transform(X)
2- การใช้StandardScaler
ข้อมูลแยก
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform (X_test)
ฉันต้องการสร้างมาตรฐานข้อมูลของฉัน แต่ฉันสับสนว่าวิธีใดดีที่สุด!