การฟอกสีฟันนั้นดีอยู่เสมอหรือไม่?


27

ขั้นตอนก่อนการประมวลผลทั่วไปสำหรับอัลกอริทึมการเรียนรู้ของเครื่องคือการทำให้ข้อมูลขาวขึ้น

ดูเหมือนว่าการฟอกสีฟันเป็นสิ่งที่ดีอยู่เสมอเนื่องจากมันไม่สัมพันธ์กับข้อมูลทำให้ง่ายต่อการสร้างแบบจำลอง

ไวท์เทนนิ่งไม่แนะนำเมื่อไหร่?

หมายเหตุ: ฉันหมายถึงการไม่มีความสัมพันธ์ของข้อมูล


1
คุณสามารถให้การอ้างอิงสำหรับการฟอกสีฟันได้หรือไม่?
Atilla Ozgur

2
ฉันคิดว่ากระทู้นี้เป็นต้นขั้ว มันควรจะขยายตัว - - คำตอบที่ได้รับการยอมรับในปัจจุบันมีข้อมูลน้อยมาก - - ฉันจะยอมรับมันและเปิดรับรางวัลที่นี่
LéoLéopold Hertz 준영

คำถามของคุณก็มีอคติด้วยโดยมี "เสมอ" ที่นั่น แน่นอนว่าการฟอกสีฟันนั้นไม่ได้ดีเสมอไป นอกจากนี้กำหนดประเภทของไวท์เทนนิ่ง ฉันคิดว่ามันนำไปสู่คำตอบที่ไม่สร้างสรรค์อย่างนี้ - - กำหนดประเภทของข้อมูลที่จะใช้ - - ฉันคิดว่าคำถามที่ดีกว่าสามารถเป็นได้คุณจะปรับปรุงการใช้ไวท์เทนนิ่งนี้ได้อย่างไรกับข้อมูลที่ดีพอนี้ . - - @AtillaOzgur แหล่งหนึ่งen.wikipedia.org/wiki/Whitening_transformationหากพิจารณาถึงการเปลี่ยนแปลงพื้นฐานของการฟอกสีฟัน
LéoLéopold Hertz 준영

คำตอบ:


13

การฟอกสีฟันก่อนกำหนดเป็นลักษณะทั่วไปของการทำให้คุณสมบัติเป็นปกติซึ่งทำให้อินพุตเป็นอิสระโดยการแปลงให้เข้ากับเมทริกซ์ความแปรปรวนร่วมที่แปลงแล้ว ฉันไม่เห็นว่าทำไมสิ่งนี้อาจเป็นสิ่งที่ไม่ดี

อย่างไรก็ตามการค้นหาอย่างรวดเร็วเผย"ความเป็นไปได้ของ Data Whitening เพื่อปรับปรุงประสิทธิภาพของ Weather Radar" ( pdf ) ซึ่งอ่าน:

โดยเฉพาะอย่างยิ่งการฟอกสีฟันทำงานได้ดีในกรณีของ ACF แบบเอ็กซ์โปเนนเชียล (ซึ่งสอดคล้องกับผลลัพธ์ของ Monakov) แต่ก็ไม่ค่อยดีนักในกรณีของเกาส์เซียน หลังจากการทดลองเชิงตัวเลขเราพบว่ากรณีเกาส์เซียนมีอาการเจ็บป่วยเป็นจำนวนมากในแง่ที่ว่าจำนวนเงื่อนไข (อัตราส่วนของค่าสูงสุดถึงค่าลักษณะเฉพาะต่ำสุด) มีขนาดใหญ่มากสำหรับเมทริกซ์ความแปรปรวนร่วมเกาส์

ฉันไม่ได้รับการศึกษามากพอที่จะแสดงความคิดเห็นเกี่ยวกับเรื่องนี้ บางทีคำตอบสำหรับคำถามของคุณคือการฟอกสีฟันนั้นดีอยู่เสมอ แต่ก็มี gotchas บางอย่าง (เช่นด้วยข้อมูลแบบสุ่มมันจะไม่ทำงานได้ดีถ้าทำผ่านฟังก์ชั่นความสัมพันธ์แบบเกาส์แบบเกาส์)


2
อย่างที่ฉันเข้าใจมันใช้งานได้ดีถ้าเมทริกซ์ความแปรปรวนร่วมนั้นประมาณไว้อย่างดี ใครบางคนสามารถแสดงความคิดเห็นเกี่ยวกับเรื่องนี้? ขอบคุณ
Ran

3
ราคาข้างต้นไม่ได้อ้างถึงเมทริกซ์ความแปรปรวนร่วมที่ประเมินได้ไม่ดี (แม้ว่าจะเป็นปัญหาเช่นกัน) มันบอกว่าสำหรับเมทริกซ์ความแปรปรวนร่วมที่ระบุอย่างสมบูรณ์ก็ยังคงเป็นเรื่องยากที่จะดำเนินการแยกตัวประกอบที่ต้องการ (และการแปลงข้อมูลที่เกี่ยวข้อง) ได้อย่างแม่นยำ นี่คือเนื่องจากตัวเลขปรับอากาศที่ไม่ดีซึ่งหมายถึงข้อผิดพลาด roundoff ความแม่นยำแน่นอนก่อให้เกิดมลพิษการคำนวณ
GeoMatt22

2
นี่เป็นคำตอบที่ไม่เพียงพอ มันมีการคัดลอกส่วนใหญ่วัสดุที่ไม่เกี่ยวข้อง - - คำตอบนี้ควรขยายออกไปจริงๆ มันเป็นต้นขั้ว
LéoLéopold Hertz 준영

20

ประการแรกฉันคิดว่าการลบความสัมพันธ์และการฟอกสีฟันเป็นสองขั้นตอนที่แยกจากกัน

ในการแยกความสัมพันธ์ของข้อมูลเราจำเป็นต้องแปลงข้อมูลเพื่อให้ข้อมูลที่ถูกแปลงจะมีเมทริกซ์ความแปรปรวนร่วมแนวทแยง การเปลี่ยนแปลงนี้สามารถพบได้โดยการแก้ปัญหาค่าลักษณะเฉพาะ เราค้นหาค่าลักษณะเฉพาะและค่าลักษณะเฉพาะที่เกี่ยวข้องของความแปรปรวนร่วมโดยการแก้Σ=XX'

ΣΦ=ΦΛ

โดยที่เป็นเมทริกซ์แนวทแยงที่มีค่าลักษณะเฉพาะเป็นองค์ประกอบเส้นทแยงมุมΛ

เมทริกซ์จึง diagonalizes เมทริกซ์ความแปรปรวนของX} คอลัมน์ของเป็นลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วมΦXΦ

นอกจากนี้เรายังสามารถเขียนความแปรปรวนแบบทแยงมุมเป็น:

(1)Φ'ΣΦ=Λ

ดังนั้นในการลดความสัมพันธ์เวกเตอร์หนึ่งตัวเราจะทำ:xผม

(2)xผม* * * *=Φ'xผม

องค์ประกอบเส้นทแยงมุม (ค่าลักษณะเฉพาะ) ในอาจจะเหมือนหรือต่างกัน ถ้าเราทำให้มันเหมือนกันทั้งหมดนี่เรียกว่าการฟอกสีข้อมูล เนื่องจากค่าลักษณะเฉพาะแต่ละค่าจะกำหนดความยาวของค่าลักษณะเฉพาะที่เกี่ยวข้องความแปรปรวนร่วมจะสอดคล้องกับวงรีเมื่อข้อมูลไม่ได้เป็นสีขาวและเป็นทรงกลม การฟอกสีฟันดำเนินการดังนี้:Λ

Λ-1/2ΛΛ-1/2=ผม

เท่ากับการแทนที่ในเราเขียน:(1)

Λ-1/2Φ'ΣΦΛ-1/2=ผม

ดังนั้นเมื่อต้องการใช้การแปลงไวท์เทนนิ่งนี้เป็นเราเพียงแค่คูณมันด้วยเครื่องชั่งนี้การได้รับจุดข้อมูลสีขาวx i :xผม* * * *xผม

(3)xผม=Λ-1/2xผม* * * *=Λ-1/2Φ'xผม

ตอนนี้ความแปรปรวนของไม่ได้เป็นเพียงเส้นทแยงมุม แต่ยังเครื่องแบบ (สีขาว) เนื่องจากความแปรปรวนของx ฉัน , E ( x ฉัน x ฉัน ' ) =ฉันxผมxผมE(xผมxผม')=ผม

Σ

และในที่สุดก็มี "gotcha" ทั่วไปที่ผู้คนควรระวัง คุณต้องระมัดระวังว่าคุณคำนวณปัจจัยการปรับสเกลบนข้อมูลการฝึกอบรมจากนั้นคุณใช้สมการ (2) และ (3) เพื่อนำปัจจัยการปรับขนาดเดียวกันไปใช้กับข้อมูลการทดสอบมิฉะนั้นคุณมีความเสี่ยงที่จะมีน้ำหนักเกิน ข้อมูลจากชุดทดสอบในกระบวนการฝึกอบรม)

ที่มา: http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf


2
ขอบคุณสำหรับการชี้แจงคุณพูดถูก ฉันหมายถึงการยกเลิกความสัมพันธ์ btw: ในตอนท้ายคุณเขียนว่าการฟอกสีฟันจะดำเนินการกับข้อมูลการฝึกอบรมเท่านั้น เท่าที่ฉันรู้คุณคำนวณเมทริกซ์จากข้อมูลการฝึกอบรม แต่คุณทำได้ทั้งในข้อมูลการฝึกอบรมและการทดสอบ
Ran

@ รันใช่นั่นคือสิ่งที่ฉันหมายถึง ... ฉันจะอัปเดตคำตอบ
tdc

มันจะดีถ้าคุณสามารถเสนอส่วนต่าง ๆ ในคำตอบของคุณ มีอินโทรสรุปและสิ่งคณิตศาสตร์ - - ฉันคิดว่าคุณไม่ได้ลงลึกในคำตอบของคุณ - - คำตอบของคุณครอบคลุมถึงข้อเสนอที่ไม่สำคัญส่วนใหญ่ แต่ไม่ลึกพอในหัวข้อ คุณมีเนื้อหาที่คัดลอกวางพื้นฐานจากบันทึกการบรรยาย แต่งานของตัวเองน้อยมากสำหรับหัวข้อ
LéoLéopold Hertz 준영

ดังนั้นในเงื่อนไขอย่างง่ายทำ pca เพื่อรับคุณสมบัติที่ไม่สัมพันธ์กันแล้วหาคุณสมบัติใหม่หารด้วยความแปรปรวนเพื่อรับคุณลักษณะที่เป็นสีขาว
อะโวคาโด

1

จากhttp://cs231n.github.io/neural-networks-2/

จุดอ่อนของการเปลี่ยนแปลงครั้งนี้คือมันสามารถเกินจริงเสียงในข้อมูลเนื่องจากมันขยายมิติทั้งหมด (รวมถึงมิติที่ไม่เกี่ยวข้องของความแปรปรวนเล็ก ๆ ที่ส่วนใหญ่เป็นเสียง) ให้มีขนาดเท่ากันในอินพุต ในทางปฏิบัติสามารถลดได้โดยการปรับให้เรียบยิ่งขึ้น ...

น่าเสียดายที่ฉันไม่ได้รับการศึกษามากพอที่จะแสดงความคิดเห็นเพิ่มเติมเกี่ยวกับเรื่องนี้


โปรดระบุว่ารูปแบบของเสียงใดที่เกินความจริง การอ้างอิงของคุณเข้มงวด มันเป็นเพียงวิทยาการคอมพิวเตอร์ขั้นพื้นฐานเกี่ยวกับหัวข้อเช่นเสียงสีขาวด้วยวิธีโครงข่ายประสาทโบราณ - - ควรกำหนดงานเกินจริง
LéoLéopold Hertz 준영

ดูเหมือนว่าฉันจะเกี่ยวข้องกับการปรับขนาดของคุณสมบัติทั้งหมดที่มีความแปรปรวนเดียวกันใช่ไหม ดังนั้นหากมีคุณลักษณะที่ความแปรปรวนในชุดการฝึกอบรมเป็นเสียงเราอาจคาดหวังว่าความแปรปรวนโดยรวมของคุณลักษณะนี้จะเล็กกว่าอีกคุณสมบัติหนึ่งมาก การแปลงนี้จะทำให้ทั้งคุณลักษณะ "เสียง" และคุณลักษณะอื่นมีความแปรปรวนเดียวกันและอาจถูกมองว่าเป็น "เครื่องขยายเสียง"
ijoseph
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.