กลยุทธ์การสอนการกระจายตัวตัวอย่าง


30

รุ่น tl; dr เวอร์ชัน ใดที่คุณใช้กลยุทธ์ที่ประสบความสำเร็จในการสอนการกระจายตัวตัวอย่าง (ของค่าเฉลี่ยตัวอย่าง) ในระดับปริญญาตรีเบื้องต้น?

พื้นหลัง

ในเดือนกันยายนฉันจะสอนหลักสูตรสถิติเบื้องต้นสำหรับนักศึกษาปีที่สองทางสังคมศาสตร์ (ส่วนใหญ่เป็นรัฐศาสตร์และสังคมวิทยา) โดยใช้David Basic Moore มันจะเป็นครั้งที่ห้าที่ผมเคยสอนหลักสูตรนี้และปัญหาหนึ่งที่ฉันเคยมีอย่างต่อเนื่องคือการที่นักเรียนได้ต่อสู้จริงๆกับความคิดของการกระจายการสุ่มตัวอย่าง มันครอบคลุมเป็นพื้นหลังสำหรับการอนุมานและปฏิบัติตามการแนะนำเบื้องต้นเกี่ยวกับความน่าจะเป็นที่พวกเขาดูเหมือนจะไม่มีปัญหาหลังจากมีอาการสะอึกเริ่มแรก (และโดยพื้นฐานแล้วฉันหมายถึงพื้นฐาน- หลังจากทั้งหมดนักเรียนเหล่านี้จำนวนมากได้รับการคัดเลือกด้วยตนเองเป็นสตรีมหลักสูตรที่เฉพาะเจาะจงเพราะพวกเขาพยายามที่จะหลีกเลี่ยงสิ่งใดก็ตามด้วยคำใบ้ที่คลุมเครือของ "คณิตศาสตร์") ฉันเดาว่าอาจจะออกจากหลักสูตร 60% โดยไม่มีความเข้าใจน้อยที่สุดประมาณ 25% เข้าใจหลักการ แต่ไม่ใช่การเชื่อมต่อกับแนวคิดอื่น ๆ และอีก 15% ที่เหลือเข้าใจอย่างถ่องแท้

ประเด็นหลัก

ปัญหาที่นักเรียนดูเหมือนมีอยู่กับแอปพลิเคชัน เป็นการยากที่จะอธิบายว่าปัญหาที่แม่นยำคืออะไรนอกจากบอกว่าพวกเขาไม่เข้าใจ จากการสำรวจความคิดเห็นที่ฉันได้ดำเนินการภาคการศึกษาที่ผ่านมาและจากการตอบการสอบฉันคิดว่าส่วนหนึ่งของความยากลำบากคือความสับสนระหว่างวลีที่เกี่ยวข้องและคล้ายกันสองเสียง (การกระจายตัวตัวอย่างและการกระจายตัวอย่าง) ดังนั้นฉันจึงไม่ใช้วลี อีกต่อไป แต่แน่นอนว่านี่คือสิ่งที่ในขณะที่เกิดความสับสนในตอนแรกสามารถเข้าใจได้ง่ายด้วยความพยายามเพียงเล็กน้อยและไม่สามารถอธิบายความสับสนทั่วไปเกี่ยวกับแนวคิดของการแจกแจงตัวอย่าง

(ฉันตระหนักว่าอาจเป็นฉันและการสอนของฉันที่เป็นปัญหาที่นี่! อย่างไรก็ตามฉันคิดว่าการเพิกเฉยต่อความเป็นไปได้ที่ไม่สะดวกนั้นมีเหตุผลที่จะทำเพราะนักเรียนบางคนดูเหมือนจะเข้าใจและโดยรวมแล้วทุกคน

สิ่งที่ฉันได้ลอง

ฉันต้องเถียงกับผู้ดูแลระบบระดับปริญญาตรีในแผนกของเราเพื่อแนะนำเซสชันในห้องปฏิบัติการคอมพิวเตอร์ที่คิดว่าการสาธิตซ้ำอาจเป็นประโยชน์ (ก่อนที่ฉันจะเริ่มสอนหลักสูตรนี้ไม่มีการใช้คอมพิวเตอร์ที่เกี่ยวข้อง) ในขณะที่ฉันคิดว่าสิ่งนี้ช่วยให้เข้าใจเนื้อหาโดยรวมของเนื้อหาหลักสูตรโดยทั่วไปฉันไม่คิดว่าหัวข้อนี้จะช่วยได้

ความคิดหนึ่งที่ฉันมีก็คือการไม่สอนอะไรเลยหรือไม่ให้น้ำหนักมากท่าทีที่ได้รับการสนับสนุนจากบางคน (เช่นAndrew Gelman ) ฉันไม่พบสิ่งนี้ที่น่าพึงพอใจโดยเฉพาะเนื่องจากมีการสอนที่รวดเร็วถึงตัวหารร่วมที่ต่ำที่สุดและที่สำคัญกว่านั้นคือปฏิเสธนักเรียนที่แข็งแกร่งและมีแรงจูงใจที่ต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการประยุกต์ใช้ทางสถิติจากการทำความเข้าใจว่า ) ในทางตรงกันข้ามนักเรียนที่เป็นสื่อกลางดูเหมือนจะเข้าใจค่า p เช่นกันดังนั้นบางทีพวกเขาไม่จำเป็นต้องเข้าใจการแจกแจงตัวอย่าง

คำถาม

คุณใช้กลยุทธ์อะไรในการสอนการกระจายตัวตัวอย่าง ฉันรู้ว่ามีวัสดุและการอภิปราย (เช่นที่นี่และที่นี่และเอกสารนี้ซึ่งเปิดไฟล์ PDF ) แต่ฉันแค่สงสัยว่าฉันจะได้รับตัวอย่างที่เป็นรูปธรรมของสิ่งที่เหมาะกับคน (หรือฉันเดาแม้สิ่งที่ไม่ทำงาน ดังนั้นฉันจะรู้ว่าไม่ต้องลอง!) แผนของฉันตอนนี้เมื่อฉันวางแผนหลักสูตรสำหรับเดือนกันยายนคือการทำตามคำแนะนำของ Gelman และ "deemphasize" การแจกแจงตัวอย่าง ฉันจะสอนมัน แต่ฉันจะรับรองกับนักเรียนว่านี่เป็นหัวข้อประเภท FYI-only และจะไม่ปรากฏในการสอบ (ยกเว้นอาจเป็นคำถามโบนัส!) อย่างไรก็ตามฉันสนใจฟังวิธีการอื่น ๆ ที่ผู้คนเคยใช้


นอกจากนี้คุณยังสามารถทำสิ่งนี้ด้วยการแจกแจงของประชากรที่ไม่ปกติเพื่อแสดงทฤษฎีบทขีด จำกัด กลาง
user41270

ขออภัยนี่ควรเป็นข้อคิดเห็นในคำตอบของฉันด้านล่าง
user41270

คำตอบ:


23

ในความคิดของฉันการแจกแจงการสุ่มตัวอย่างเป็นแนวคิดหลักของสถิติ 101 คุณอาจข้ามหลักสูตรไปเป็นข้ามประเด็นนั้น อย่างไรก็ตามผมมากคุ้นเคยกับความจริงที่ว่านักเรียนเพียงแค่ไม่ได้รับมันดูเหมือนว่าไม่ว่าสิ่งที่คุณทำ ฉันมีชุดของกลยุทธ์ สิ่งเหล่านี้อาจใช้เวลานาน แต่ฉันขอแนะนำให้ข้าม / ย่อหัวข้ออื่น ๆ เพื่อให้แน่ใจว่าพวกเขาได้รับแนวคิดเกี่ยวกับการกระจายตัวตัวอย่าง นี่คือเคล็ดลับ:

  • พูดอย่างชัดเจน: ครั้งแรกฉันพูดถึงอย่างชัดเจนว่ามีการแจกแจงที่แตกต่างกัน 3 อย่างที่เราเกี่ยวข้อง: การกระจายของประชากรการกระจายตัวอย่างและการกระจายตัวอย่าง ฉันพูดสิ่งนี้ซ้ำไปซ้ำมาตลอดบทเรียนและจากนั้นเป็นวรรคเป็นเวรตลอดหลักสูตร ทุกครั้งที่ผมพูดคำเหล่านี้ผมเน้นตอนจบที่โดดเด่น: sam- PLE , samp- ลิง (ใช่นักเรียนเบื่อสิ่งนี้พวกเขายังได้แนวคิด)
  • ใช้รูปภาพ (ตัวเลข): ฉันมีชุดของตัวเลขมาตรฐานที่ฉันใช้ทุกครั้งที่ฉันพูดถึงเรื่องนี้ มีการแจกแจงภาพสามภาพชัดเจนและโดยทั่วไปจะมีป้ายกำกับ (ป้ายกำกับที่มีตัวเลขนี้อยู่บนสไลด์ PowerPoint และมีคำอธิบายสั้น ๆ ดังนั้นจึงไม่ปรากฏที่นี่ แต่เห็นได้ชัดว่าเป็น: ประชากรที่อยู่ด้านบนจากนั้นสุ่มตัวอย่างแล้วกระจายตัวอย่าง)
    ป้อนคำอธิบายรูปภาพที่นี่
  • ให้กิจกรรมของนักเรียน: ครั้งแรกที่คุณแนะนำแนวคิดนี้ไม่ว่าจะเป็นการเปิดนิคเคิล (บางไตรมาสอาจหายไป) หรือลูกเต๋า 6 ด้าน ให้นักเรียนจัดกลุ่มเล็ก ๆ แล้วสร้างชุดของค่า 10 ค่าและค่าเฉลี่ย จากนั้นคุณสามารถสร้างฮิสโตแกรมบนบอร์ดหรือด้วย Excel
  • ใช้ภาพเคลื่อนไหว (แบบจำลอง): ฉันเขียนโค้ดบางส่วน (ไม่มีประสิทธิภาพอย่างตลก) ใน R เพื่อสร้างข้อมูลและแสดงผลในขณะใช้งาน ส่วนนี้มีประโยชน์อย่างยิ่งเมื่อคุณเปลี่ยนไปอธิบายทฤษฎีบทขีด จำกัด กลาง (สังเกตSys.sleep()คำแถลงหยุดเหล่านี้ให้เวลาฉันสักครู่เพื่ออธิบายสิ่งที่เกิดขึ้นในแต่ละขั้นตอน)
N = 10
number_of_samples = 1000


iterations  = c(3, 7, number_of_samples)  
breakpoints = seq(10, 91, 3)  
meanVect    = vector()  
x           = seq(10, 90)  
height      = 30/dnorm(50, mean=50, sd=10)  
y           = height*dnorm(x, mean=50, sd=10)  

windows(height=7, width=5)  
par(mfrow=c(3,1), omi=c(0.5,0,0,0), mai=c(0.1, 0.1, 0.2, 0.1))  

for(i in 1:iterations[3]) {  
  plot(x,y, type="l", col="blue", axes=F, xlab="", ylab="")  
  segments(x0=20, y0=0, x1=20, y1=y[11], col="lightgray")  
  segments(x0=30, y0=0, x1=30, y1=y[21], col="gray")  
  segments(x0=40, y0=0, x1=40, y1=y[31], col="darkgray")  
  segments(x0=50, y0=0, x1=50, y1=y[41])  
  segments(x0=60, y0=0, x1=60, y1=y[51], col="darkgray")  
  segments(x0=70, y0=0, x1=70, y1=y[61], col="gray")  
  segments(x0=80, y0=0, x1=80, y1=y[71], col="lightgray")  
  abline(h=0)  

  if(i==1) {  
    Sys.sleep(2)  
  }  
  sample = rnorm(N, mean=50, sd=10)  
  points(x=sample, y=rep(1,N), col="green", pch="*")  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  xhist1 = hist(sample, breaks=breakpoints, plot=F)  
  hist(sample, breaks=breakpoints, axes=F, col="green", xlim=c(10,90),  
       ylim=c(0,N), main="", xlab="", ylab="")  
  if(i==iterations[3]) {  
    abline(v=50)  
  }  

  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
  sampleMean = mean(sample)  
  segments(x0=sampleMean, y0=0, x1=sampleMean,   
           y1=max(xhist1$counts)+1, col="red", lwd=3)  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  meanVect = c(meanVect, sampleMean)  
  hist(meanVect, breaks=x, axes=F, col="red", main="",   
       xlab="", ylab="", ylim=c(0,((N/3)+(0.2*i))))  
  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
}  

Sys.sleep(2)  
xhist2 = hist(meanVect, breaks=x, plot=F)  
xMean  = round(mean(meanVect), digits=3)  
xSD    = round(sd(meanVect), digits=3)  
histHeight = (max(xhist2$counts)/dnorm(xMean, mean=xMean, sd=xSD))  
lines(x=x, y=(histHeight*dnorm(x, mean=xMean, sd=xSD)),   
      col="yellow", lwd=2)  
abline(v=50)  

txt1 = paste("population mean = 50     sampling distribution mean = ",  
             xMean, sep="")  
txt2 = paste("SD = 10     10/sqrt(", N,") = 3.162     SE = ", xSD,  
            sep="")  
mtext(txt1, side=1, outer=T)  
mtext(txt2, side=1, line=1.5, outer=T)  
  • ประเมินแนวคิดเหล่านี้ใหม่ตลอดภาคการศึกษา: ฉันนำแนวคิดของการแจกแจงตัวอย่างมาอีกครั้งทุกครั้งที่เราพูดถึงเรื่องต่อไป (โดยทั่วไปแล้วจะสั้นมาก) สถานที่ที่สำคัญที่สุดสำหรับสิ่งนี้คือเมื่อคุณสอน ANOVA เนื่องจากกรณีสมมุติฐานว่าง ๆ มีสถานการณ์ที่คุณสุ่มตัวอย่างจากการกระจายตัวของประชากรเดียวกันหลายครั้งและชุดกลุ่มของคุณหมายถึงการกระจายตัวอย่างเชิงประจักษ์ (สำหรับตัวอย่างนี้ดูคำตอบของฉันที่นี่: ข้อผิดพลาดมาตรฐานทำงานอย่างไร )

1
นี่เป็นคำตอบที่ดี (+1) ฉันคิดว่ากิจกรรมและการจำลองเป็นประโยชน์อย่างยิ่งสำหรับการสอนวิชานี้ ในหลักสูตรเบื้องต้นฉันสอนสองสามครั้งเราใช้เว็บแอปเพล็ตที่อนุญาตให้นักเรียนมองเห็นว่าสถิติคำนวณจากตัวอย่างและฮิสโตแกรมของการกระจายตัวตัวอย่างเริ่มเป็นรูปเป็นร่างเมื่อคุณทำซ้ำหลายครั้ง ฉันคิดว่ากิจกรรมนั้นช่วยเหลือมากกว่าสิ่งใด ๆ ที่ฉันเคยพูดกับนักเรียนเมื่อต้องทำความเข้าใจกับการสุ่มตัวอย่างแบบกระจาย :)
มาโคร

+1 ขอบคุณ Gung นั่นเป็นคำตอบที่ยอดเยี่ยม! ขอขอบคุณที่ "ส่งรหัสถึงฉัน" ด้วย (ผู้ใช้ Mac แทนwindows(...)ด้วยquartz(...)) ประเด็นของคุณเกี่ยวกับการนำแนวคิดมาใช้ใหม่ตลอดทั้งภาคการศึกษาเป็นประโยชน์อย่างยิ่ง ฉันคิดว่าการทำตามคำแนะนำเหล่านี้จะมีประโยชน์จริงๆ
smillig

(+1) สำหรับมนต์ "การแจกแจง 3" และสำหรับรูปภาพเชิงสัมพันธ์ ไม่มีใครสามารถเข้าใจแนวคิดโดยไม่ต้องเข้าใจก่อนว่ามันเป็นแนวคิดที่แตกต่างแน่นอน
Alecos Papadopoulos

ฉันพบหน้า " หนังสือสถิติออนไลน์ " ของ Rice University เกี่ยวกับการกระจายตัวตัวอย่างมีประโยชน์มากสำหรับเรื่องนี้ เวอร์ชันเดิมอายุหลายปีมีแอปเพล็ต Java แต่ฉันดีใจที่พวกเขาได้จัดแจงใหม่ใน Javascript วิธีการทำงานเป็นหลักเหมือนกับไดอะแกรมของคุณ
Silverfish

8

ฉันมีโชคบางอย่างกับนักเรียนเตือนว่าการกระจายการสุ่มตัวอย่างคือการกระจายของสถิติทดสอบบนพื้นฐานของการสุ่มตัวอย่าง ฉันให้นักเรียนคิดเกี่ยวกับสิ่งที่จะเกิดขึ้นในกระบวนการสุ่มตัวอย่างเองนั้นมีความลำเอียง ตัวอย่างเช่น "การแจกแจงตัวอย่าง" ดูเหมือนว่ากระบวนการสุ่มตัวอย่างของเราเลือกชุดย่อย (พิเศษ) เดียวกันเสมอ จากนั้นฉันจะพิจารณาว่า "การแจกแจงการสุ่มตัวอย่าง" จะเป็นอย่างไรถ้ากระบวนการสุ่มตัวอย่างของเราเลือกชุดย่อยเฉพาะ (พิเศษ) สองชุดเท่านั้น (แต่ละชุดมีความน่าจะเป็น 1/2) สิ่งเหล่านี้ค่อนข้างง่ายในการคำนวณหาค่าเฉลี่ยตัวอย่าง (โดยเฉพาะอย่างยิ่งสำหรับตัวเลือกเฉพาะของ "พิเศษ" สำหรับประชากรต้นแบบ)

ฉันคิดว่านักเรียนบางคน (ไม่ชัดเจนทั้งหมด) สิ่งนี้ดูเหมือนจะช่วยพวกเขาด้วยแนวคิดที่ว่าการกระจายตัวตัวอย่างสามารถแตกต่างจากการกระจายตัวของประชากรได้อย่างมาก ฉันยังใช้ตัวอย่างทฤษฎีบทขีด จำกัด กลางที่ Michael Chernick พูดถึงด้วยความสำเร็จ - โดยเฉพาะอย่างยิ่งกับการแจกแจงที่ไม่ธรรมดา (การจำลองดูเหมือนจะช่วยได้จริง)


Graham Cookson มีแบบฝึกหัดในชั้นเรียนที่ดีซึ่งโพสต์เป็นคำตอบใน "คำอธิบายของคนธรรมดาที่คุณชื่นชอบสำหรับแนวคิดทางสถิติที่ยากลำบากคืออะไร" - วิกิชุมชน
shoda

+1 พูดคุยเกี่ยวกับการกระจายตัวตัวอย่างของตัวอย่างที่ไม่ใช่แบบสุ่มจะเป็นความคิดที่ดี
gung - Reinstate Monica

+1 แนวคิดที่ยอดเยี่ยมเกี่ยวกับการเลือกชุดย่อย! ฉันคิดว่านี่คือลิงค์ที่คุณอ้างถึง @shoda: stats.stackexchange.com/a/554/9249
smillig

7

ฉันเริ่มต้นด้วยการสอนความน่าจะเป็น ฉันไม่ได้นิยามและกฎอย่างเป็นทางการจำนวนมาก (เวลาไม่เพียงพอ) แต่แสดงความน่าจะเป็นโดยการจำลอง ปัญหา Monty Hall เป็นตัวอย่างที่ดีในการใช้งานฉันแสดงผ่านการจำลอง (แล้วติดตามด้วยตรรกะ) ว่ากลยุทธ์ในการสลับจะให้โอกาสในการชนะสูงกว่า ฉันชี้ให้เห็นว่าโดยการจำลองเราสามารถเล่นเกมได้หลายครั้ง (โดยไม่มีความเสี่ยงหรือผลตอบแทน) เพื่อประเมินกลยุทธ์และนั่นทำให้เราเลือกกลยุทธ์ที่ดีกว่า (ถ้าเราเคยอยู่ในสถานการณ์นั้น) การเลือกกลยุทธ์ที่ดีกว่าไม่ได้รับประกันว่าจะชนะ แต่มันให้โอกาสเราที่ดีกว่าและช่วยเลือกระหว่างกลยุทธ์ จากนั้นฉันชี้ให้เห็นว่าสิ่งนี้จะนำไปใช้กับหลักสูตรที่เหลือได้อย่างไรว่าจะช่วยให้เราเลือกกลยุทธ์ที่มีองค์ประกอบแบบสุ่ม

จากนั้นเมื่อฉันแนะนำการแจกแจงตัวอย่างฉันเริ่มด้วยการจำลองอีกครั้งและบอกว่าเราต้องการพัฒนากลยุทธ์ เช่นเดียวกับปัญหา Monty Hall ในชีวิตจริงเราจะสามารถสุ่มตัวอย่างได้ 1 ตัวอย่างเท่านั้น แต่เราสามารถจำลองกลุ่มตัวอย่างเพื่อช่วยเราพัฒนากลยุทธ์ได้ จากนั้นฉันจะแสดงการจำลองของกลุ่มตัวอย่างจำนวนมากจากประชากรเดียวกัน (ประชากรที่รู้จักกันในกรณีนี้) และแสดงความสัมพันธ์ที่เราเรียนรู้จากการจำลอง (ฮิสโตแกรมของค่าเฉลี่ยตัวอย่าง) ตัวอย่างคือตัวอย่างหมายถึงกลุ่มรอบค่าเฉลี่ยจริง ค่าเบี่ยงเบนมาตรฐานขนาดเล็กของการแจกแจงตัวอย่างสำหรับตัวอย่างที่ใหญ่กว่าปกติมากขึ้นสำหรับตัวอย่างที่ใหญ่กว่า ตลอดเวลาที่ฉันพูดคุยเกี่ยวกับการทำซ้ำความคิดของการจำลองเพื่อเลือกกลยุทธ์เพียงความคิดเดียวกับปัญหา Monty Hall ที่ใช้ในขณะนี้เพื่อสุ่มตัวอย่างแทนการแสดงเกม จากนั้นฉันก็แสดงกฎอย่างเป็นทางการและบอกว่านอกจากการจำลองพวกเขาสามารถพิสูจน์ทางคณิตศาสตร์ได้ แต่ฉันจะไม่ทำข้อพิสูจน์ในชั้นเรียนทั้งหมด ฉันเสนอว่าถ้าพวกเขาต้องการเห็นหลักฐานทางคณิตศาสตร์จริง ๆ พวกเขาสามารถมาทำงานได้หนึ่งชั่วโมงและฉันจะแสดงคณิตศาสตร์ให้พวกเขา (ไม่มีใครในชั้นเรียนอินโทรได้พาฉันมาที่นี่)

จากนั้นเมื่อเราได้ข้อสรุปฉันบอกว่าเราจะทำได้เพียง 1 ตัวอย่างในโลกแห่งความเป็นจริงเหมือนที่เราจะได้เล่นเกม 1 ครั้ง (มากที่สุด) แต่เราสามารถใช้กลยุทธ์ที่เราเรียนรู้จากการจำลอง ตัวอย่างจำนวนมากเพื่อพัฒนากลยุทธ์ (z-test, t-test หรือสูตร CI) ที่จะให้คุณสมบัติที่เลือกกับเรา (โอกาสที่จะถูกต้อง) เช่นเดียวกับเกมเราไม่ทราบก่อนที่เราจะเริ่มต้นหากข้อสรุปสุดท้ายของเราจะถูกต้อง (และโดยปกติแล้วเรายังไม่รู้ในภายหลัง) แต่เรารู้จากการจำลองและการกระจายตัวอย่างสิ่งที่น่าจะเป็นในระยะยาวคือการใช้ กลยุทธ์นั้น

นักเรียน 100% มีความเข้าใจที่สมบูรณ์หรือไม่ ไม่ แต่ฉันคิดว่าพวกเขามีแนวคิดทั่วไปที่เราสามารถใช้กฎการจำลองและคณิตศาสตร์ (ซึ่งพวกเขาดีใจที่พวกเขาไม่ต้องดูเพียงแค่เชื่อหนังสือ / ผู้สอน) เพื่อเลือกกลยุทธ์ / สูตรที่มี คุณสมบัติที่ต้องการ


+1 ขอบคุณที่แบ่งปันคำแนะนำนี้ ฉันคิดว่าคุณถูกจับด้วยปัญหาที่เกิดจากการเชื่อมโยงระหว่างสิ่งที่เราสามารถสอนเกี่ยวกับสิ่งที่การกระจายตัวตัวอย่างเป็นอย่างไรกับวิธีการที่สามารถคาดการณ์ถึงการอนุมานจากตัวอย่างเดียว ตามที่คุณ (และคนอื่น ๆ ที่นี่) ได้แนะนำการทำซ้ำแนวคิดอย่างต่อเนื่องตลอดหลักสูตรเป็นสิ่งสำคัญ แต่ไม่ได้ทำบ่อย ๆ (อย่างน้อยก็ไม่ใช่ฉันอาจเป็นเพราะฉันพบว่ามันยากพอที่จะพอดีกับทุกสิ่งที่ฉันต้องการ นับประสากลับไปที่แนวคิดครอบคลุมแล้ว!)
smillig

3

นี่เป็นปัญหาที่สำคัญมากและมีความคิดที่ดีในส่วนของคุณ ฉันคิดว่าแนวคิดของการกระจายตัวตัวอย่างนั้นแตกต่างกันไปตามพื้นฐานของการอนุมานความเข้าใจและควรสอน

ฉันได้สอนหลักสูตรสถิติเบื้องต้นจำนวนมากโดยเฉพาะในวิชาชีวสถิติ ฉันสอนแนวคิดของการกระจายตัวตัวอย่างและมีวิธีการที่ฉันคิดว่าดี แต่ไม่ได้ผลตอบรับที่ดีจริงๆเพื่อพิจารณาว่าฉันประสบความสำเร็จกับพวกเขาได้อย่างไร อย่างไรก็ตามนี่คือสิ่งที่ฉันทำ

ก่อนอื่นฉันพยายามให้คำจำกัดความง่ายๆ การแจกแจงตัวอย่างคือการแจกแจงที่สถิติการทดสอบจะมีหากกระบวนการตัวอย่างซ้ำหลายครั้ง ขึ้นอยู่กับการกระจายของประชากรที่ข้อมูลถูกสันนิษฐานว่าสร้างขึ้น

แม้ว่าฉันคิดว่านี่เป็นคำนิยามที่เรียบง่ายอย่างที่ฉันสามารถให้ฉันรู้ว่ามันไม่ง่ายและความเข้าใจในแนวคิดจะไม่มาในทันทีในกรณีส่วนใหญ่ ดังนั้นติดตามสิ่งนี้ด้วยตัวอย่างพื้นฐานที่ตอกย้ำสิ่งที่พูดด้วยคำจำกัดความ

22

จากนั้นฉันจะติดตามด้วยแอปพลิเคชั่นที่สำคัญทฤษฎีบทขีด จำกัด กลาง ในเงื่อนไขที่ง่ายที่สุดทฤษฎีขีด จำกัด กลางกล่าวว่าสำหรับการแจกแจงจำนวนมากที่ไม่ปกติการแจกแจงการสุ่มตัวอย่างสำหรับค่าเฉลี่ยตัวอย่างจะใกล้เคียงกับการแจกแจงแบบปกติเมื่อขนาดตัวอย่าง n มีขนาดใหญ่ เพื่อแสดงให้เห็นว่าการแจกแจงแบบนี้เหมือนกัน (การกระจายแบบ bimodal ก็ดูดีด้วย) และแสดงว่าการกระจายตัวตัวอย่างสำหรับค่าเฉลี่ยนั้นมีลักษณะอย่างไรสำหรับขนาดตัวอย่าง 3, 4, 5, 10 และ 100 นักเรียนสามารถดูได้ว่า รูปร่างของการกระจายเปลี่ยนไปจากสิ่งที่ดูไม่ปกติเลยสำหรับ n ตัวเล็กเป็นบางอย่างที่ดูเหมือนการกระจายตัวแบบปกติสำหรับ n ขนาดใหญ่

เพื่อโน้มน้าวให้นักเรียนเห็นว่าการแจกแจงตัวอย่างเหล่านี้มีรูปร่างเหล่านี้จริง ๆ ให้นักเรียนทำการจำลองการสร้างตัวอย่างจำนวนมากขนาดต่าง ๆ และคำนวณค่าเฉลี่ยตัวอย่าง จากนั้นให้พวกเขาสร้างฮิสโตแกรมสำหรับการประมาณค่าเฉลี่ยเหล่านี้ ฉันขอแนะนำให้ใช้การสาธิตทางกายภาพเพื่อแสดงให้เห็นว่าการทำงานนี้ใช้กระดาน quincunx ได้อย่างไร ในขณะที่ทำสิ่งนี้คุณจะชี้ให้เห็นว่าอุปกรณ์สร้างตัวอย่างของผลรวมของการทดลอง Bernoulli อิสระโดยที่ความน่าจะเป็นที่จะไปทางซ้ายหรือขวาในแต่ละระดับเท่ากับ 1/2 สแต็คผลลัพธ์ที่ด้านล่างแสดงฮิสโตแกรมสำหรับการแจกแจงการสุ่มตัวอย่าง (ทวินาม) และรูปร่างของมันสามารถดูปกติประมาณหลังจากลูกบอลจำนวนมากลงที่ด้านล่างของควินซัน


ขอบคุณสำหรับคำแนะนำที่มีค่า ฉันชอบความคิดของการสาธิตทางกายภาพจริง ๆ และจะลองใช้สิ่งนี้อย่างแน่นอน (สมมติว่าฉันสามารถเบี่ยงเบนความสนใจของพวกเขาจาก facebook นานพอ ... ) แม้ว่าการเชื่อมต่อกับผลรวมของการทดลอง Bernoulli ที่เป็นอิสระ หัว! ขอบคุณ
smillig

1
แต่การเห็นรูปแบบการแจกแจงแบบปกติจากการทดลองนั้นเป็นการเปิดตาจริงๆ ครั้งแรกที่ฉันเห็นสิ่งเหล่านี้แสดงให้เห็นที่พิพิธภัณฑ์วิทยาศาสตร์ในชิคาโกเมื่อฉันยังเป็นเด็ก (อายุประมาณ 10 ปี) ไม่ทราบอะไรเกี่ยวกับสถิติ แต่ไม่เคยลืมเส้นโค้ง
Michael R. Chernick

1

ฉันคิดว่ามันเป็นการดีที่จะใส่ 'ประชากร' ของตัวเลขไว้ในถุง (ตั้งแต่ 1-10) คุณสามารถสร้างกระเบื้องของคุณเองหรือใช้เหรียญเล่นไพ่ ฯลฯ

ให้นักเรียนนั่งเป็นกลุ่ม (5 คนขึ้นไป) และเลือกหมายเลขออกจากกระเป๋า แต่ละกลุ่มจะคำนวณค่าเฉลี่ยสำหรับกลุ่มของพวกเขา บอกพวกเขาว่าก่อนหน้านี้คุณหาค่าเฉลี่ยประชากรแล้วพล็อตมันลงบนฮิสโตแกรมและให้สมาชิกของแต่ละกลุ่มมาและพล็อตค่าเฉลี่ยตัวอย่างของพวกเขาในโปรแกรมประวัติศาสตร์ที่อยู่รอบ ๆ ให้พวกเขาทำสิ่งนี้ excerise สองสามครั้งเพื่อ 'สร้างฮิสโตแกรม'

จากนั้นคุณจะสามารถแสดงรูปแบบการเปลี่ยนแปลงในค่าเฉลี่ยตัวอย่างรอบค่าเฉลี่ยประชากร คำนวณความแปรปรวนของค่าเฉลี่ยตัวอย่างเทียบกับค่าเฉลี่ยประชากร ฉันคิดว่านักเรียนจำได้ชัดเจนว่าทำแบบฝึกหัดภาคปฏิบัติและแนวคิดของการสุ่มตัวอย่างจะกลับมาหาพวกเขาได้ง่ายขึ้น มันอาจฟังดูเป็นเรื่องเล็กน้อย แต่บางครั้งนักเรียนก็เหมือนกับการเปลี่ยนแปลงที่จะทำอะไรบางอย่างที่ใช้งาน .... มีโอกาสไม่มากที่จะทำสิ่งนี้ในสถิติ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.