การย่อยสลายความแปรปรวนแบบอคติ


13

ในส่วนที่ 3.2 ของการจดจำรูปแบบของอธิการและการเรียนรู้ของเครื่องจักรเขากล่าวถึงการสลายตัวของความแปรปรวนแบบอคติโดยระบุว่าสำหรับฟังก์ชันการสูญเสียกำลังสองการสูญเสียที่คาดหวังสามารถแยกย่อยเป็นระยะอคติกำลังสอง (ซึ่งอธิบายว่า รุ่น), คำแปรปรวน (ซึ่งอธิบายการแพร่กระจายของการทำนายรอบค่าเฉลี่ย) และคำที่มีเสียงรบกวน (ซึ่งให้เสียงที่แท้จริงของข้อมูล)

  1. สามารถทำการไบอัส - แปรปรวนการสลายตัวด้วยฟังก์ชั่นการสูญเสียอื่น ๆ นอกเหนือจากการสูญเสียกำลังสอง?
  2. สำหรับชุดข้อมูลโมเดลที่กำหนดมีมากกว่าหนึ่งโมเดลที่มีการสูญเสียที่คาดว่าจะต่ำกว่าทุกโมเดลและถ้าเป็นเช่นนั้นนั่นหมายความว่าอาจมีการผสมผสานระหว่างอคติและความแปรปรวนต่างกัน
  3. หากแบบจำลองเกี่ยวข้องกับการทำให้เป็นมาตรฐานจะมีความสัมพันธ์ทางคณิตศาสตร์ระหว่างอคติความแปรปรวนและสัมประสิทธิ์การทำให้เป็นมาตรฐานหรือไม่?λ
  4. คุณจะคำนวณอคติได้อย่างไรถ้าคุณไม่รู้รูปแบบที่แท้จริง?
  5. มีสถานการณ์ที่เหมาะสมหรือไม่ที่จะลดอคติหรือความแปรปรวนมากกว่าการสูญเสียที่คาดหวังไว้ (ผลรวมของความเอนเอียงและความแปรปรวนกำลังสอง)

คำตอบ:


3

... การสูญเสียที่คาดหวัง [กำลังสองผิดพลาด] สามารถแบ่งออกเป็นเทอมอคติกำลังสอง (ซึ่งอธิบายว่าการทำนายโดยเฉลี่ยนั้นมาจากแบบจำลองที่แท้จริงมากแค่ไหน) คำที่แปรปรวน (ซึ่งอธิบายการแพร่กระจายของการทำนายรอบค่าเฉลี่ย) และ คำที่มีเสียงรบกวน (ซึ่งให้เสียงที่แท้จริงของข้อมูล)

เมื่อมองไปที่การสูญเสียข้อผิดพลาดกำลังสอง ผมเห็นเพียงสองข้อหนึ่งสำหรับอคติและอีกคนหนึ่งสำหรับความแปรปรวนของประมาณการหรือทำนายที่n}) ไม่มีเสียงรบกวนเพิ่มเติมในการสูญเสียที่คาดว่าจะเป็น อย่างที่ควรจะเป็นเนื่องจากความแปรปรวนคือความแปรปรวนของไม่ใช่ตัวอย่างเองδ

Eθ[(θδ(X1:n))2]=(θEθ[δ(X1:n)])2+Eθ[(Eθ[δ(X1:n)]δ(X1:n))2]
δ ( X 1 : n )δ(X1:n)δ(X1:n)
  1. สามารถทำการไบอัส - แปรปรวนการสลายตัวด้วยฟังก์ชั่นการสูญเสียอื่น ๆ นอกเหนือจากการสูญเสียกำลังสอง?

การตีความของฉันของอคติกำลังสอง + การสลายตัวความแปรปรวน [และวิธีที่ฉันสอน] คือว่านี่คือสถิติเชิงเทียบเท่าของทฤษฎีบทของพีธากอร์นั่นคือระยะห่างระหว่างสแควร์ระหว่างตัวประมาณและจุดหนึ่งในเซตหนึ่งคือผลรวมของ ระหว่างตัวประมาณกับเซตบวกระยะห่างกำลังสองระหว่างการฉายฉากมุมฉากบนชุดกับจุดภายในชุด การสูญเสียใด ๆ ขึ้นอยู่กับระยะทางที่มี nFor สำหรับชุดข้อมูลโมเดลที่กำหนดมีมากกว่าหนึ่งโมเดลที่มีการสูญเสียที่คาดว่าจะเป็นขั้นต่ำสำหรับทุกรุ่นและถ้าเป็นเช่นนั้นนั่นหมายความว่าอาจมีอคติและความแปรปรวนต่างๆ การสูญเสียขั้นต่ำแบบเดียวกันที่คาดการณ์ไว้ของการฉายฉากมุมฉากคือผลิตภัณฑ์ภายในคือโดยพื้นฐานแล้วช่องว่างของฮิลแบร์ตเป็นไปตามการย่อยสลายนี้

  1. สำหรับชุดข้อมูลโมเดลที่กำหนดมีมากกว่าหนึ่งโมเดลที่มีการสูญเสียที่คาดว่าจะต่ำกว่าทุกโมเดลและถ้าเป็นเช่นนั้นนั่นหมายความว่าอาจมีการผสมผสานระหว่างอคติและความแปรปรวนต่างกัน

คำถามนั้นไม่ชัดเจน: ถ้าอย่างน้อยที่สุดคุณจะหมายถึง มีหลายตัวอย่างของ แบบจำลองทางสถิติและการตัดสินใจที่เกี่ยวข้องกับคงขาดทุนที่คาดว่า (หรือความเสี่ยง) ยกตัวอย่าง MLE ของค่าเฉลี่ย

minθEθ[(θδ(X1:n))2]
  1. คุณจะคำนวณอคติได้อย่างไรถ้าคุณไม่รู้รูปแบบที่แท้จริง?

ในความหมายทั่วไปอคติคือระยะห่างระหว่างตัวแบบที่แท้จริงและตัวแบบที่ใกล้เคียงที่สุดในตระกูลการแจกแจงแบบสมมติ หากไม่ทราบโมเดลจริงจะสามารถตรวจสอบความเบี่ยงเบนได้โดย bootstrap

  1. มีสถานการณ์ที่เหมาะสมหรือไม่ที่จะลดอคติหรือความแปรปรวนมากกว่าการสูญเสียที่คาดหวังไว้ (ผลรวมของความเอนเอียงและความแปรปรวนกำลังสอง)

เมื่อพิจารณาฟังก์ชันการสูญเสียอื่นเช่น กดเป็นศูนย์ทำให้การประเมินส่วนใหญ่เกี่ยวกับอคติในขณะที่กดไปยังอินฟินิตี้สลับ มุ่งเน้นไปที่ความแปรปรวน

(θEθ[δ(X1:n)])2+α[(Eθ[δ(X1:n)]δ(X1:n))2]0<α
αα

ระยะเสียงที่ OP อ้างถึงนั้นมาจากข้อเท็จจริงที่ว่าตัวประมาณไม่ได้เป็นพารามิเตอร์ แต่สำหรับฟังก์ชั่นในแบบจำลองโดยที่ (อิสระ) เสียงสันนิษฐานว่ามี ศูนย์ค่าเฉลี่ยและความแปรปรวน\การเพิ่มและลบก่อนแล้วจึงในมีใครมาถึงการสลายตัวดังกล่าวY = F ( X ) + ε ε σ ε F ( X ) E [ F ( X ) ] E [ ( Y - F ( X ) ) 2 | X = x ] σ 2 ε + อคติ2 F ( x ) + Var F ( x )fY=f(X)+ϵϵσϵf(X)E[f^(X)]E[(Yf(X))2|X=x]σϵ2+Bias2f^(x)+Varf^(x)
Miguel

นี่คือการสันนิษฐานเป็นอิสระจากซึ่งดูเหมือนจะไม่มีข้อสมมติฐานที่เป็นจริง εf^ϵ
ซีอาน

อืมคุณถูกต้องแน่นอน แต่ฉันคิดว่าปัญหานี้เป็นสิ่งประดิษฐ์ที่มาจากความเลอะเทอะของฉัน ตรวจสอบหน้า 23 ของ ESLII ของ Hastie & Tibshirani
Miguel

@Miguel: ในความเป็นจริงเราคิดให้เป็นอิสระจาก X ไม่{F} โดยส่วนตัวแล้วฉันพบว่า ESL (และอื่น ๆ อีกมากมาย) นั้นไม่ได้มาอย่างเข้มงวดทำให้เกิดความสับสน การได้มาของศาสตราจารย์ Mostafa ใน "การเรียนรู้จากข้อมูล" ควรเป็นสิ่งที่คุณกำลังมองหาหรือในโพสต์นี้: stats.stackexchange.com/questions/164378/…ϵf^
SiXUlm
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.