การสุ่มตัวอย่างที่สำคัญคืออะไร?


23

ฉันพยายามเรียนรู้การเสริมแรงและหัวข้อนี้ทำให้ฉันสับสนจริงๆ ฉันได้แนะนำสถิติไปแล้ว แต่ฉันไม่เข้าใจหัวข้อนี้อย่างสังหรณ์ใจ

คำตอบ:


15

การสุ่มตัวอย่างความสำคัญเป็นรูปแบบของการสุ่มตัวอย่างจากการกระจายที่แตกต่างจากการกระจายความสนใจเพื่อให้ได้รับการประมาณที่ดีขึ้นของพารามิเตอร์จากการกระจายความสนใจ โดยทั่วไปสิ่งนี้จะให้ค่าประมาณของพารามิเตอร์ที่มีความแปรปรวนต่ำกว่าที่จะได้รับจากการสุ่มตัวอย่างโดยตรงจากการแจกแจงเริ่มต้นที่มีขนาดตัวอย่างเท่ากัน

มันถูกใช้ในบริบทต่าง ๆ โดยทั่วไปการสุ่มตัวอย่างจากการแจกแจงที่แตกต่างกันช่วยให้สามารถสุ่มตัวอย่างได้มากขึ้นในส่วนของการกระจายความสนใจที่กำหนดโดยแอปพลิเคชัน (ภูมิภาคสำคัญ)

ตัวอย่างหนึ่งอาจเป็นได้ว่าคุณต้องการมีตัวอย่างที่มีตัวอย่างจากหางของการแจกแจงมากกว่าการสุ่มตัวอย่างแบบบริสุทธิ์จากการแจกแจงความสนใจ

บทความวิกิพีเดียที่ฉันได้เห็นในเรื่องนี้เป็นนามธรรมเกินไป มันเป็นการดีกว่าที่จะดูตัวอย่างเฉพาะต่างๆ อย่างไรก็ตามมันมีลิงค์ไปยังแอพพลิเคชั่นที่น่าสนใจเช่นBayesian Networks

ตัวอย่างหนึ่งของการสุ่มตัวอย่างที่สำคัญในทศวรรษที่ 1940 และ 1950 คือเทคนิคการลดความแปรปรวน (รูปแบบของวิธีมอนติคาร์โล) ดูตัวอย่างหนังสือวิธีมอนติคาร์โลโดยแฮมเมอร์สลีย์และ Handscomb ตีพิมพ์เป็น Methuen Monograph / Chapman และ Hall ในปี 1964 และพิมพ์ซ้ำในปี 1966 และต่อมาโดยสำนักพิมพ์อื่น ๆ มาตรา 5.4ของหนังสือครอบคลุมการสุ่มตัวอย่างสำคัญ


2
ในการเพิ่มไปนี้: ใน RL คุณมักจะใช้การสุ่มตัวอย่างที่สำคัญกับนโยบาย: เช่นการสุ่มตัวอย่างจากนโยบายการสำรวจแทนนโยบายจริงที่คุณต้องการตัวอย่างจริง
DaVinci

3
การตอบกลับนี้เริ่มต้นได้ดีด้วยการอธิบายว่าการสุ่มตัวอย่างที่สำคัญทำอะไรแต่ฉันรู้สึกผิดหวังที่พบว่ามันไม่เคยตอบคำถามที่ว่าการสุ่มตัวอย่างที่สำคัญคืออะไร
whuber

@whuber เป้าหมายของฉันที่นี่คือการอธิบายแนวคิดของ OP ที่สับสนและชี้ให้เขาเห็นวรรณกรรมบางอย่าง เป็นหัวข้อใหญ่และใช้ในแอปพลิเคชันที่แตกต่างกัน คนอื่นอาจอธิบายรายละเอียดด้วยคำศัพท์ง่ายกว่าที่ฉันสามารถทำได้ ฉันรู้ว่าเมื่อคุณตัดสินใจที่จะตอบคำถามคุณจะได้หมูและกราฟที่ดีให้ไปดูรายละเอียดทางเทคนิคโดยใช้ภาษาธรรมดา โพสต์เหล่านั้นสร้างความพึงพอใจให้กับชุมชนด้วยความชัดเจนและความสมบูรณ์ของชุมชนและฉันก็กล้าพูดว่ายังทำให้ OP เป็นที่น่าพอใจ บางทีประโยคสองสามประโยคที่มีสมการอาจพอเพียงตามที่คุณแนะนำ
Michael R. Chernick

อาจจะเป็นการดีกว่าที่ชุมชนจะตอบคำถามแทนการชี้ไปยังแหล่งข้อมูลอื่นหรือแม้กระทั่งจัดหาลิงก์ ฉันแค่รู้สึกว่าสิ่งที่ฉันทำนั้นเพียงพอและ OP ที่ยอมรับว่าเป็นผู้เริ่มหัดทำสถิติควรพยายามด้วยตัวเองก่อน
Michael R. Chernick

5
คุณมีประเด็น แต่ฉันสงสัยว่ามันอาจเป็นไปได้ในอีกหนึ่งหรือสองประโยค - ไม่มีคณิตศาสตร์ไม่มีกราฟไม่มีงานพิเศษใด ๆ - เพื่อให้คำตอบสำหรับคำถามที่ถาม ในกรณีนี้คำอธิบายจะต้องเน้นว่ามีการประมาณความคาดหวัง (ไม่ใช่แค่ "พารามิเตอร์") จากนั้นบางทีอาจชี้ให้เห็นว่าเนื่องจากความคาดหวังผลรวมของค่าและความน่าจะเป็นผลลัพธ์เดียวกันโดยการเปลี่ยนความน่าจะเป็น เป็นการแจกแจงที่ง่ายต่อการสุ่มตัวอย่างจาก) และการปรับค่าเพื่อชดเชยสิ่งนั้น
whuber

33

การสุ่มตัวอย่างความสำคัญเป็นวิธีการจำลองหรือวิธีมอนติคาร์โลซึ่งมีไว้สำหรับการประมาณอินทิเกรต คำว่า "การสุ่มตัวอย่าง" ค่อนข้างสับสนว่ามันไม่ได้ตั้งใจที่จะให้ตัวอย่างจากการแจกแจงที่กำหนด

สัญชาตญาณที่อยู่เบื้องหลังการสุ่มตัวอย่างที่สำคัญคืออินทิกรัลที่นิยามไว้อย่างดีเช่น สามารถแสดงความคาดหวังในช่วงกว้าง การแจกแจงความน่าจะเป็น: โดยที่หมายถึงความหนาแน่น ของการกระจายความน่าจะเป็นและจะถูกกำหนดโดยและเอฟ(โปรดทราบว่ามักจะแตกต่างจาก )จริง ๆ แล้วทางเลือก นำไปสู่ความเท่าเทียมและ

I=Xh(x)dx
I=Ef[H(X)]=XH(x)f(x)dx
fHhfH()h()
H(x)=h(x)f(x)
H(x)f(x)=h(x)I=Ef[H(X)]ภายใต้ข้อ จำกัด บางประการเกี่ยวกับการสนับสนุนของหมายถึงเมื่อ -ดังนั้นดังที่ W. Huber ได้ชี้ให้เห็นในความคิดเห็นของเขาไม่มีความเป็นเอกภาพในการเป็นตัวแทนของอินทิกรัลว่าเป็นความคาดหวัง แต่ตรงกันข้ามกับอาเรย์ที่ไม่สิ้นสุดของการเป็นตัวแทนดังกล่าวบางอันก็ดีกว่าคนอื่น ๆ พวกเขาถูกนำมาใช้ ตัวอย่างเช่น Michael Chernick กล่าวถึงการเลือกเพื่อลดความแปรปรวนของตัวประมาณff(x)>0h(x)0f

เมื่อเข้าใจคุณสมบัติเบื้องต้นแล้วการดำเนินการตามแนวความคิดนี้ต้องอาศัยกฎจำนวนมากเช่นเดียวกับวิธีการมอนติคาร์โลอื่น ๆ เช่นการจำลอง [ผ่านเครื่องกำเนิดไฟฟ้าแบบหลอกเทียม] ตัวอย่าง iidแจกจ่ายจากและใช้การประมาณ ซึ่ง(x1,,xn)f

I^=1ni=1nH(xi)
  1. เป็นตัวประมาณค่าI
  2. ลู่เข้าใกล้I

ขึ้นอยู่กับทางเลือกของการแจกแจงผู้ประมาณการอาจมีหรือไม่มีความแปรปรวนแน่นอน อย่างไรก็ตามมีอยู่เสมอตัวเลือกของที่อนุญาตให้มีการแปรปรวนแน่นอนและแม้กระทั่งสำหรับการแปรปรวนขนาดเล็กโดยพล (แม้ว่าตัวเลือกเหล่านั้นอาจไม่สามารถใช้ได้ในทางปฏิบัติ และยังมีอยู่ทางเลือกของที่ทำให้ความสำคัญของการสุ่มตัวอย่างประมาณการประมาณยากจนมากของ{I}} ซึ่งรวมถึงตัวเลือกทั้งหมดที่ความแปรปรวนไม่สิ้นสุดแม้ว่าบทความล่าสุดโดย Chatterjee และ Diaconis จะศึกษาวิธีเปรียบเทียบตัวอย่างสำคัญกับความแปรปรวนอนันต์ ภาพด้านล่างนำมาจากfI^ffI^Iการอภิปรายบล็อกของฉันของหนังสือพิมพ์และแสดงให้เห็นถึงการบรรจบกันที่ดีของการประมาณค่าความแปรปรวนที่ไม่มีที่สิ้นสุด

การสุ่มตัวอย่างความสำคัญพร้อมการกระจายที่สำคัญการแจกแจงประสบการณ์ Exp (1) การกระจายการแจกแจง Exp (1/10) และฟังก์ชันที่สนใจ $ h (x) = x $  มูลค่าที่แท้จริงของอินทิกรัลคือ $ 10 $

การสุ่มตัวอย่างความสำคัญกับการกระจายความสำคัญประสบการณ์ (1) การกระจายเป้าหมายการกระจาย Exp (1/10) การจัดจำหน่ายและฟังก์ชั่นที่น่าสนใจ x มูลค่าที่แท้จริงของหนึ่งคือ10h(x)=x10

[ข้อความต่อไปนี้ทำซ้ำจากวิธีการทางสถิติ Monte Carloหนังสือของเรา]

ตัวอย่างต่อไปนี้จากริปลีย์ (1987) แสดงให้เห็นว่าทำไมมันจริงอาจจ่ายในการสร้างจากการจัดจำหน่ายอื่น ๆ กว่า (เดิม) การกระจายปรากฏในการหนึ่ง ดอกเบี้ยหรือกล่าวอีกนัยหนึ่งเพื่อปรับเปลี่ยนการแทนค่าอินทิกรัลตามที่คาดหวังกับความหนาแน่นที่กำหนดf

Xh(x)f(x)dx

ตัวอย่าง (ความน่าจะเป็นหาง Cauchy) สมมติว่าปริมาณความสนใจคือความน่าจะเป็น, , ตัวแปรCauchyค่ามากกว่านั่นคือ เมื่อถูกประเมินผ่านค่าเฉลี่ยเชิงประจักษ์ ของตัวอย่าง iidความแปรปรวนของตัวประมาณนี้คือ (เท่ากับตั้งแต่ )pC(0,1)2

p=2+1π(1+x2)dx.
p
p^1=1mj=1mIXj>2
X1,,Xm C(0,1)p(1p)/m0.127/mp=0.15

ความแปรปรวนนี้สามารถลดลงได้โดยคำนึงถึงลักษณะสมมาตรของเนื่องจากค่าเฉลี่ย มีความแปรปรวนเท่ากับ mC(0,1)

p^2=12mj=1mI|Xj|>2
p(12p)/2m0.052/m

(ที่ญาติ) การขาดประสิทธิภาพของวิธีการเหล่านี้เกิดจากการสร้างค่านอกโดเมนที่น่าสนใจที่ซึ่งเป็นในความรู้สึกบางอย่างที่ไม่เกี่ยวข้องสำหรับการประมาณของพี[เรื่องนี้เกี่ยวข้องกับไมเคิลเชอร์นิคกล่าวถึงการประเมินพื้นที่หาง] ถ้าถูกเขียนเป็น อินทิกรัลด้านบนถือเป็นความคาดหวังของ , โดยที่2]} วิธีการประเมินทางเลือกสำหรับจึงเป็น สำหรับ[2,+)pp

p=12021π(1+x2)dx,
h(X)=2/π(1+X2)XU[0,2]p
p^3=121mj=1mh(Uj)
UjU[0,2]. ความแตกต่างของคือ และการรวมโดยส่วนต่าง ๆ แสดงให้เห็นว่ามันเท่ากับ . ยิ่งกว่านั้นเนื่องจากสามารถเขียนเป็น อินทิกรัลนี้ยังถูกมองว่าเป็นความคาดหวังของ ต่อการกระจายแบบสม่ำเสมอในและการประเมินอีกครั้งคือ เมื่อ2]} การรวมกันโดยส่วนต่างๆแสดงให้เห็นว่าความแปรปรวนของp^3(E[h2]E[h]2)/m0.0285/mp
p=01/2y2π(1+y2)dy,
[ 0 , 1 / 2 ] พีพี 4 = 114h(Y)=1/2π(1+Y2)[0,1/2]pY J ~ U [ 0 , 1 / 2 ]
p^4=14mj=1mh(Yj)
YjU[0,1/2]p^4คือ m0.95104/m

เมื่อเทียบกับการลดความแปรปรวนที่นำมาจาก มีลำดับซึ่งบ่งบอกเป็นพิเศษว่าการประเมินนี้ต้องการ การจำลองน้อยกว่าเท่า เพื่อให้ได้ความแม่นยำเดียวกัน p^1p^4103100032p^1


5
ขอบคุณ @Xi 'สำหรับปัญหาการแสดงตัวอย่างที่สำคัญในแบบที่ทุกคนสามารถชื่นชมและฉันคิดว่าเป็นไปตามคำขอของ Bill Huber +1
Michael R. Chernick

2
ฉันต้องการที่จะทราบว่าในตอนแรกโพสต์นี้ถูกพักไว้และต้องขอบคุณการมีส่วนร่วมของหลาย ๆ คน เราได้มากับหัวข้อข้อมูล
Michael R. Chernick

5
คริสเตียนฉันต้องการขยายความขอบคุณและแสดงความรู้สึกถึงสิทธิพิเศษที่คุณแบ่งปันเนื้อหาที่ยอดเยี่ยมกับเราอย่างแข็งขัน
whuber

4
ฉันแค่อยากจะเพิ่มคำขอบคุณไปยังซีอานที่ใจดีพอที่จะทำการแก้ไขสองสามครั้งเพื่อปรับปรุงคำตอบของฉันแม้ว่าเขาจะให้คำตอบของเขาเองก็ตาม
Michael R. Chernick

3
นี่เป็นหนึ่งในกระทู้ที่ดีที่สุดใน stats.stackexchange ขอบคุณสำหรับการแบ่งปัน!
dohmatob
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.