ฉันชอบคำตอบการวิเคราะห์ที่ได้รับจาก Glen_b มันเป็นคำตอบที่ดี
มันต้องการรูปภาพ ฉันชอบรูปภาพ
นี่คือพื้นที่ของความยืดหยุ่นในการตอบคำถาม:
- มีการกระจายในโลกมากมาย ระยะทางมีแนวโน้มที่จะแตกต่างกันไป
- เพียงพอมีความหมายต่างกัน สำหรับตัวอย่างการนับทฤษฏีบางครั้งต้องมีการนับตัวอย่างเดียวเพื่อให้ได้ "เพียงพอ" สำหรับการสาธิตอัตราความบกพร่องต่ำโดยใช้ความไม่แน่นอนของทวินามนับร้อยหรือพันตัวอย่าง
สำหรับมาตรฐานทั่วไปฉันใช้รหัส MatLab ต่อไปนี้:
mysamples=1000;
loops=10000;
y1=median(normrnd(0,1,mysamples,loops));
cdfplot(y1)
และฉันได้พล็อตต่อไปนี้เป็นเอาต์พุต:
เหตุใดจึงไม่ทำเช่นนี้กับการแจกแจงแบบ "มีอยู่ในตัว" อีก 22 ตัวยกเว้นการใช้โพรบพล็อต (ที่เส้นตรงมีความหมายเหมือนปกติมาก)
และนี่คือซอร์สโค้ดสำหรับมัน:
mysamples=1000;
loops=600;
y=zeros(loops,23);
y(:,1)=median(random('Normal', 0,1,mysamples,loops));
y(:,2)=median(random('beta', 5,0.2,mysamples,loops));
y(:,3)=median(random('bino', 10,0.5,mysamples,loops));
y(:,4)=median(random('chi2', 10,mysamples,loops));
y(:,5)=median(random('exp', 700,mysamples,loops));
y(:,6)=median(random('ev', 700,mysamples,loops));
y(:,7)=median(random('f', 5,3,mysamples,loops));
y(:,8)=median(random('gam', 10,5,mysamples,loops));
y(:,9)=median(random('gev', 0.24, 1.17, 5.8,mysamples,loops));
y(:,10)=median(random('gp', 0.12, 0.81,mysamples,loops));
y(:,11)=median(random('geo', 0.03,mysamples,loops));
y(:,12)=median(random('hyge', 1000,50,20,mysamples,loops));
y(:,13)=median(random('logn', log(20000),1.0,mysamples,loops));
y(:,14)=median(random('nbin', 2,0.11,mysamples,loops));
y(:,15)=median(random('ncf', 5,20,10,mysamples,loops));
y(:,16)=median(random('nct', 10,1,mysamples,loops));
y(:,17)=median(random('ncx2', 4,2,mysamples,loops));
y(:,18)=median(random('poiss', 5,mysamples,loops));
y(:,19)=median(random('rayl', 0.5,mysamples,loops));
y(:,20)=median(random('t', 5,mysamples,loops));
y(:,21)=median(random('unif',0,1,mysamples,loops));
y(:,22)=median(random('unid', 5,mysamples,loops));
y(:,23)=median(random('wbl', 0.5,2,mysamples,loops));
figure(1); clf
hold on
for i=2:23
subplot(4,6,i-1)
probplot(y(:,i))
title(['Probplot of ' num2str(i)])
axis tight
if not(isempty(find(i==[3,11,12,14,18,22])))
set(gca,'Color','r')
end
end
เมื่อฉันเห็นหลักฐานการวิเคราะห์ฉันอาจคิดว่า "ในทางทฤษฎีพวกเขาทั้งหมดอาจเหมาะสม" แต่เมื่อฉันลองแล้วฉันสามารถอารมณ์ด้วย "มีหลายวิธีนี้ไม่ทำงานได้ดีมักเกี่ยวข้องกับการแยกหรือ จำกัด มาก ค่านิยม "และสิ่งนี้อาจทำให้ฉันต้องการที่จะระมัดระวังมากขึ้นเกี่ยวกับการใช้ทฤษฎีกับสิ่งที่ค่าใช้จ่ายเงิน
โชคดี.