ขั้นตอนการประมวลผลล่วงหน้าที่เหมาะสมในการดำเนินการวิเคราะห์ส่วนประกอบอิสระคืออะไร


17

ขั้นตอนที่เหมาะสมสำหรับการประมวลผลสัญญาณของฉันล่วงหน้าเพื่อดำเนินการวิเคราะห์ส่วนประกอบอิสระ (ICA) ในภายหลังคืออะไร? ฉันเข้าใจวิธีที่แม้ว่าคำอธิบายเพิ่มเติมของที่ไม่เจ็บ แต่ฉันสนใจมากขึ้นในสาเหตุ


ฉันไม่แน่ใจว่าทำไมคุณต้องทำการประมวลผลล่วงหน้า มีเหตุผลใดเป็นพิเศษหรือไม่?
Phonon

@Phonon ฉันพบผู้ตรวจสอบที่ได้รวบรวมข้อมูลของพวกเขาก่อนที่จะดำเนินการกับ ICA ฉันแค่สงสัยว่ามีวิธีมาตรฐานหรือไม่
jonsca

น่าสนใจมาก. ฉันชอบที่จะเห็นคำตอบที่สร้างสรรค์
Phonon

1
ในกรณีของการวิเคราะห์สเปกตรัมบนสัญญาณ EEG คนขาวเพื่อลดผลกระทบของรูปร่างของสเปกตรัมซึ่งมักจะซ่อนสิ่งที่น่าสนใจที่ความถี่สูง อย่างน้อยก็มีการสนทนาเล็ก ๆ น้อย ๆ นี้เป็น ที่นี่ในอุปกรณ์เสริม ไม่ว่าจะเป็นเคล็ดลับทั่วไปก่อนโดยเฉพาะอย่างยิ่ง ICA ไม่แน่ใจ แอปพลิเคชันของคุณเป็นสัญญาณ EEG / MEG / LFP หรือไม่ บางทีคนที่ทำ ICA อาจตอบคำถามนี้ได้อย่างสมบูรณ์ถ้าลางสังหรณ์ของฉันถูกต้อง คำถามที่น่าสนใจ - ฉันจะอ่านมัน 1/
ImAlsoGreg

1
@Gigili นั่นเป็นส่วนหนึ่งของคำถามด้วย ขั้นตอนใดที่ถือว่าเป็นขั้นตอนปกติ
jonsca

คำตอบ:


15

การวิเคราะห์องค์ประกอบอิสระ (ICA) จะใช้ในการแยกเชิงเส้นส่วนผสมของสถิติอิสระและที่สำคัญที่สุดไม่ใช่เสียนส่วนประกอบเข้าไปมันเป็นคนละเรื่อง รุ่นมาตรฐานสำหรับ ICA ที่ปราศจากเสียงรบกวนคือ

x=As

โดยที่คือการสังเกตหรือเวกเตอร์ข้อมูลsเป็นสัญญาณต้นทาง / ส่วนประกอบดั้งเดิม (ไม่ใช่แบบเกาส์) และxsเป็นเวกเตอร์การแปลงที่กำหนดการผสมเชิงเส้นของสัญญาณส่วนประกอบ โดยทั่วไปแล้ว Aและ sไม่เป็นที่รู้จักAAs

ก่อนการประมวลผล

มีสองกลยุทธ์หลักในการประมวลผลล่วงหน้าใน ICA คือการจัดกึ่งกลางและการฟอกสี / sphering เหตุผลหลักสำหรับการประมวลผลล่วงหน้าคือ:

  • ลดความซับซ้อนของอัลกอริทึม
  • การลดมิติของปัญหา
  • การลดจำนวนพารามิเตอร์ที่จะประมาณ
  • การเน้นคุณสมบัติของชุดข้อมูลที่ไม่ได้อธิบายอย่างง่ายดายโดยค่าเฉลี่ยและความแปรปรวนร่วม

จากการแนะนำของ G. Li และ J. Zhang, "Sphering และคุณสมบัติของมัน", The Indian Journal of Statistics, Vol. 60, Series A, Part I, pp. 119-133, 1998:

Outliers, clusters หรือกลุ่มชนิดอื่น ๆ และความเข้มข้นใกล้กับส่วนโค้งหรือส่วนที่ไม่ใช่พื้นผิวนั้นเป็นคุณสมบัติที่สำคัญที่นักวิเคราะห์ข้อมูลที่น่าสนใจ โดยทั่วไปแล้วพวกเขาไม่สามารถหาได้จากเพียงแค่ความรู้เกี่ยวกับค่าเฉลี่ยตัวอย่างและเมทริกซ์ความแปรปรวนร่วม ในสถานการณ์เหล่านี้เป็นที่พึงปรารถนาที่จะแยกข้อมูลที่มีอยู่ในค่าเฉลี่ยและเมทริกซ์ความแปรปรวนร่วมและบังคับให้เราตรวจสอบแง่มุมต่าง ๆ ของชุดข้อมูลของเรานอกเหนือจากธรรมชาติที่เข้าใจกันดี การจัดกึ่งกลางและ sphering เป็นวิธีที่ง่ายและใช้งานง่ายที่กำจัดข้อมูลค่าเฉลี่ยความแปรปรวนร่วมและช่วยในการเน้นโครงสร้างที่เกินความสัมพันธ์เชิงเส้นและรูปร่างรูปไข่และดังนั้นจึงมักจะดำเนินการก่อนที่จะสำรวจแสดงหรือวิเคราะห์ชุดข้อมูล

1. อยู่ตรงกลาง:

ตรงกลางคือการดำเนินการง่ายมากและเพียงหมายถึงการหักค่าเฉลี่ย } ในทางปฏิบัติคุณใช้ค่าเฉลี่ยตัวอย่างและสร้างเวกเตอร์ใหม่x c = x - ¯ xโดยที่¯ xE{x}x=x-x¯x¯เป็นค่าเฉลี่ยของข้อมูล การลบค่าเฉลี่ยทางเรขาคณิตนั้นเท่ากับการแปลจุดศูนย์กลางของพิกัดไปยังจุดกำเนิด ค่าเฉลี่ยสามารถเพิ่มเข้าไปในผลลัพธ์ได้ตลอดเวลาจุดสิ้นสุด (เป็นไปได้เนื่องจากการคูณเมทริกซ์คือการกระจาย)

2. ไวท์เทนนิ่ง:

ไวท์เทนนิ่งมีการเปลี่ยนแปลงที่แปลงข้อมูลดังกล่าวว่ามีความแปรปรวนเมทริกซ์เอกลักษณ์เช่นฉัน โดยปกติคุณจะทำงานกับเมทริกซ์ความแปรปรวนร่วมตัวอย่างE{xxT}=ผม

Σ^=.xxT

ที่เป็นเพียงตัวยึดตำแหน่งขี้เกียจของฉันสำหรับปัจจัยการทำให้ปกติที่เหมาะสม (ขึ้นอยู่กับขนาดของx ) เวกเตอร์สีขาวใหม่ถูกสร้างขึ้นเป็นx

xW=Σ^-1/2x

ซึ่งจะมีความแปรปรวนของฉันเรขาคณิตไวท์เทนนิ่งเป็นปรับการเปลี่ยนแปลง นี่คือตัวอย่างเล็ก ๆ ใน Mathematica:ผม

s = RandomReal[{-1, 1}, {2000, 2}];
A = {{2, 3}, {4, 2}};
x = s.A;
whiteningMatrix = Inverse@CholeskyDecomposition[Transpose@x.x/Length@x];
y = x.whiteningMatrix;
FullGraphics@GraphicsRow[
  ListPlot[#, AspectRatio -> 1, Frame -> True] & /@ {s, x, y}]

ป้อนคำอธิบายรูปภาพที่นี่

พล็อตแรกคือความหนาแน่นร่วมกันของสองกระจายอย่างสม่ำเสมอเวกเตอร์แบบสุ่มหรือส่วนประกอบsแสดงให้เห็นว่าสองผลกระทบของการคูณด้วยการเปลี่ยนแปลงเวกเตอร์ สแควร์จะเบ้และปรับขนาดเป็นรูปสี่เหลี่ยมขนมเปียกปูน โดยการคูณกับเมทริกซ์ไวท์เทนนิ่งความหนาแน่นของรอยต่อจะกลับไปเป็นสี่เหลี่ยมจัตุรัสซึ่งหมุนจากเดิมเล็กน้อยsA

เนื่องจากการแปลงไวท์เทนนิ่งในระบบใหม่ที่ถูกแก้ไขนั่นคือ , A wคือเมทริกซ์มุมฉาก สามารถแสดงได้อย่างง่ายดาย:xW=AWsWAW

E{xWxWT}=E{AWsW(AWsW)T}=AWE{sWsWT}AWT=AWAWT=ผม

sผมA

หากหลังจากการแปลงมีค่าลักษณะเฉพาะใกล้ศูนย์แล้วสิ่งเหล่านี้สามารถถูกทิ้งอย่างปลอดภัยเนื่องจากเป็นเพียงเสียงรบกวนและจะขัดขวางการประมาณค่าเนื่องจาก "overlearning"

3. การประมวลผลล่วงหน้าอื่น ๆ

อาจมีขั้นตอนการประมวลผลล่วงหน้าอื่น ๆ ที่เกี่ยวข้องในบางแอปพลิเคชันเฉพาะที่ไม่สามารถครอบคลุมคำตอบได้ ตัวอย่างเช่นฉันเคยเห็นบทความสองสามข้อที่ใช้บันทึกของอนุกรมเวลาและอีกสองสามบทความที่กรองอนุกรมเวลา แม้ว่ามันอาจจะเหมาะสำหรับแอปพลิเคชั่น / เงื่อนไขเฉพาะของพวกเขา แต่ผลลัพธ์นั้นไม่ได้นำไปใช้กับทุกสาขา

ฉันเชื่อว่าเป็นไปได้ที่จะใช้ ICA หากส่วนประกอบอย่างใดอย่างหนึ่งส่วนใหญ่เป็นแบบเกาส์ถึงแม้ว่าฉันไม่สามารถหาข้อมูลอ้างอิงได้ในตอนนี้


ทำไมจึงเรียกว่า "sphering"

nn{-1,1}NormalDistribution[]

ป้อนคำอธิบายรูปภาพที่นี่

ข้อแรกคือความหนาแน่นของรอยต่อสำหรับ Gaussians ที่ไม่ได้เกี่ยวข้องสองตัวที่สองภายใต้การเปลี่ยนแปลงและที่สามคือหลังจากไวท์เทนนิ่ง ในทางปฏิบัติเฉพาะขั้นตอนที่ 2 และ 3 เท่านั้นที่มองเห็นได้


2
ว้าวมันจะพาฉันไปสักหน่อยเพื่อรับสิ่งนั้นเข้าด้วยกัน แต่ต้องขอบคุณจริงๆ
jonsca

ขออภัยฉันคิดว่าฉันยอมรับแล้ว
jonsca
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.