คำถามติดแท็ก normality-assumption

วิธีการทางสถิติหลายอย่างสมมติว่ามีการกระจายข้อมูลตามปกติ ใช้แท็กนี้สำหรับคำถามเกี่ยวกับสมมติฐานและการทดสอบความเป็นมาตรฐานหรือเกี่ยวกับความปกติเป็นคุณสมบัติ * ใช้ [การแจกแจงแบบปกติ] สำหรับคำถามเกี่ยวกับการแจกแจงแบบปกติ

2
การกระจายตัวของสารตกค้างที่คาดหวังในตัวแบบเชิงเส้นทั่วไปคืออะไร
ฉันกำลังแสดงโมเดลเชิงเส้นทั่วไปที่ฉันต้องระบุครอบครัวที่แตกต่างจากครอบครัวปกติ การกระจายของสารตกค้างที่คาดหวังคืออะไร? ตัวอย่างเช่นส่วนที่เหลือควรกระจายตามปกติ?

2
พล็อต QQ ไม่ตรงกับฮิสโตแกรม
ฉันมีฮิสโตแกรมความหนาแน่นของเคอร์เนลและการกระจายผลตอบแทนทางการเงินแบบปกติที่ติดตั้งไว้ซึ่งเปลี่ยนเป็นความสูญเสีย (สัญญาณเปลี่ยน) และพล็อต QQ ปกติของข้อมูลเหล่านี้: พล็อต QQ แสดงให้เห็นชัดเจนว่าก้อยไม่ได้ติดตั้งอย่างถูกต้อง แต่ถ้าฉันดูฮิสโตแกรมและการกระจายแบบปกติที่ติดตั้ง (สีฟ้า) แม้ค่ารอบ 0.0 จะไม่ถูกต้อง ดังนั้นพล็อต QQ แสดงให้เห็นว่ามีเพียงหางที่ไม่เหมาะสม แต่เห็นได้ชัดว่าการกระจายทั้งหมดไม่ได้ติดตั้งอย่างถูกต้อง ทำไมสิ่งนี้ถึงไม่ปรากฏในพล็อต QQ?

4
ฉันสามารถใช้คะแนน Z กับข้อมูลที่เอียงและไม่ปกติได้หรือไม่ [ปิด]
ปิด คำถามนี้ต้องการรายละเอียดหรือความคมชัด ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ เพิ่มรายละเอียดและชี้แจงปัญหาโดยแก้ไขโพสต์นี้ ปิดให้บริการใน5 ปีที่ผ่านมา ฉันทำงานกับข้อมูลรอบเวลากระบวนการบางอย่างและปรับขนาดโดยใช้คะแนน z มาตรฐานเพื่อเปรียบเทียบระหว่างส่วนของรอบเวลาทั้งหมด ฉันควรใช้การแปลงรูปแบบอื่นเนื่องจากข้อมูลมีความเบ้อย่างหนัก / ไม่ปกติใช่หรือไม่ ('ค่าผิดปกติ' ไม่สามารถใช้เวลาติดลบและมักใช้เวลานานกว่า 'ค่าเฉลี่ย' มาก) การใช้คะแนน z ยังคงดูเหมือนว่า "ทำงาน" ... ############### # R code ############### mydata <- rweibull(1000,1,1.5) hist(mydata) hist(scale(mydata))

2
ข้อสมมติฐานเชิงบรรทัดฐานอะไรบ้างที่จำเป็นสำหรับการทดสอบแบบไม่มีคู่ แล้วพวกเขาจะพบกันเมื่อไหร่?
หากเราต้องการทำการทดสอบแบบจับคู่ความต้องการคือ (ถ้าฉันเข้าใจอย่างถูกต้อง) ว่าความแตกต่างเฉลี่ยระหว่างหน่วยการวัดที่ตรงกันจะถูกกระจายตามปกติ ในการทดสอบ t-test แบบคู่ซึ่งเป็นข้อต่อ (AFAIK) ในความต้องการว่าความแตกต่างระหว่างหน่วยการวัดที่ตรงกันจะถูกกระจายตามปกติ (แม้ว่าการกระจายตัวของกลุ่มเปรียบเทียบทั้งสองกลุ่มจะไม่ปกติ) อย่างไรก็ตามในการทดสอบแบบไม่จับคู่เราไม่สามารถพูดคุยเกี่ยวกับความแตกต่างระหว่างหน่วยที่ตรงกันดังนั้นเราต้องการให้การสังเกตจากทั้งสองกลุ่มเป็นเรื่องปกติเพื่อให้ความแตกต่างของค่าเฉลี่ยของพวกเขาเป็นเรื่องปกติ ซึ่งทำให้ฉันคำถามของฉัน: เป็นไปได้หรือไม่สำหรับการแจกแจงแบบไม่ปกติสองแบบเพื่อให้ความแตกต่างของค่าเฉลี่ยถูกกระจายตามปกติ (และตอบสนองความต้องการที่จำเป็นของเราในการดำเนินการทดสอบ t ที่ไม่มีคู่กับพวกเขา - อีกครั้ง - เท่าที่ฉันเข้าใจ) อัปเดต: (ขอบคุณทุกคำตอบ) ฉันเห็นว่ากฎทั่วไปที่เรากำลังมองหาคือความแตกต่างของค่าเฉลี่ยจะเป็นเรื่องปกติซึ่งน่าจะเป็นข้อสันนิษฐานที่ดี (ต่ำกว่าพอ n) เนื่องจาก CLT นี่เป็นสิ่งที่น่าอัศจรรย์สำหรับฉัน (ไม่น่าแปลกใจเพียงแค่น่าอัศจรรย์) สำหรับวิธีการนี้สำหรับการทดสอบแบบไม่ใช้คู่ แต่ไม่ได้ผลสำหรับการทดสอบตัวอย่างแบบเดี่ยว นี่คือรหัส R เพื่อแสดง: n1 <- 10 n2 <- 10 mean1 <- 50 mean2 <- 50 R <- 10000 # diffs …

1
การทดสอบชุดข้อมูลขนาดใหญ่เพื่อหาข้อได้เปรียบ - อย่างไรและเชื่อถือได้อย่างไร?
ฉันกำลังตรวจสอบส่วนหนึ่งของชุดข้อมูลของฉันที่มีค่าสองเท่า 46840 ตั้งแต่ 1 ถึง 1690 จัดกลุ่มในสองกลุ่ม เพื่อที่จะวิเคราะห์ความแตกต่างระหว่างกลุ่มเหล่านี้ฉันเริ่มต้นด้วยการตรวจสอบการกระจายของค่าเพื่อเลือกการทดสอบที่ถูกต้อง ทำตามคำแนะนำในการทดสอบความเป็นมาตรฐานฉันทำ qqplot, histogram & boxplot นี่ดูเหมือนจะไม่ใช่การแจกแจงแบบปกติ เนื่องจากไกด์ระบุค่อนข้างถูกต้องว่าการตรวจสอบเชิงกราฟิกล้วนไม่เพียงพอฉันจึงต้องการทดสอบการแจกแจงแบบปกติ เมื่อพิจารณาถึงขนาดของชุดข้อมูลและข้อ จำกัด ของการทดสอบ shapiro-wilks ใน R แล้วการแจกแจงที่ให้มาจะถูกทดสอบเพื่อความเป็นมาตรฐานและพิจารณาขนาดของชุดข้อมูลเป็นสิ่งที่น่าเชื่อถือหรือไม่ ( ดูคำตอบที่ยอมรับสำหรับคำถามนี้ ) แก้ไข: ข้อ จำกัด ของการทดสอบ Shapiro-Wilk ที่ฉันอ้างถึงคือชุดข้อมูลที่จะทดสอบนั้น จำกัด ไว้ที่ 5,000 คะแนน หากต้องการอ้างอิงคำตอบที่ดีอีกข้อเกี่ยวกับหัวข้อนี้: ปัญหาเพิ่มเติมของการทดสอบของ Shapiro-Wilk คือเมื่อคุณป้อนข้อมูลเพิ่มเติมโอกาสในการปฏิเสธสมมติฐานที่ใหญ่กว่านั้นจะกลายเป็นเรื่องใหญ่ ดังนั้นสิ่งที่เกิดขึ้นก็คือสำหรับข้อมูลจำนวนมากแม้จะตรวจพบความเบี่ยงเบนเล็ก ๆ น้อย ๆ จากภาวะปกติซึ่งนำไปสู่การปฏิเสธเหตุการณ์สมมติฐานว่างสำหรับการใช้งานจริงข้อมูลนั้นมากกว่าปกติพอ [... ] โชคดีที่ shapiro.test ปกป้องผู้ใช้จากเอฟเฟกต์ที่อธิบายข้างต้นโดย จำกัด …

1
อะไรคือดัชนีที่ดีของระดับของการละเมิดกฎเกณฑ์และฉลากที่สื่อความหมายสามารถแนบกับดัชนีนั้นได้?
บริบท: ในคำถามก่อนหน้านี้ @Robbie ถามในการศึกษามีประมาณ 600 กรณีว่าทำไมการทดสอบภาวะปกติอย่างมีนัยสำคัญปัญหาที่ไม่ปกติยังแปลงปัญหาการแจกแจงปกติ หลายคนระบุว่าการทดสอบความสำคัญของภาวะปกตินั้นไม่มีประโยชน์มากนัก ด้วยตัวอย่างขนาดเล็กการทดสอบดังกล่าวไม่มีอำนาจมากพอที่จะตรวจจับการละเมิดกฎเกณฑ์และตัวอย่างที่มีขนาดใหญ่พวกเขาจะตรวจพบการละเมิดกฎเกณฑ์ที่มีขนาดเล็กเพียงพอไม่ต้องกังวล สำหรับฉันแล้วดูเหมือนว่าปัญหานี้จะคล้ายกับการอภิปรายเกี่ยวกับการทดสอบที่สำคัญและขนาดผลกระทบ หากคุณมุ่งเน้นเฉพาะการทดสอบที่สำคัญเมื่อคุณมีกลุ่มตัวอย่างขนาดใหญ่คุณสามารถตรวจจับเอฟเฟ็กต์เล็ก ๆ ที่ไม่เกี่ยวข้องกับการใช้งานจริงและตัวอย่างขนาดเล็กคุณไม่มีพลังเพียงพอ ในบางกรณีที่ฉันเคยเห็นหนังสือแนะนำคนที่คุณสามารถมีตัวอย่าง "ใหญ่เกินไป" เพราะเอฟเฟกต์ขนาดเล็กจะมีความสำคัญทางสถิติ ในบริบทของการทดสอบอย่างมีนัยสำคัญและขนาดของเอฟเฟ็กต์การแก้ปัญหาอย่างง่ายอย่างหนึ่งคือการมุ่งเน้นไปที่การประเมินขนาดของเอฟเฟกต์ที่น่าสนใจแทนที่จะหมกมุ่นอยู่กับกฎการตัดสินใจแบบไบนารีว่ามีหรือไม่มีผล ช่วงความเชื่อมั่นที่มีต่อขนาดเอฟเฟกต์เป็นหนึ่งในวิธีการดังกล่าวหรือคุณสามารถใช้วิธีการแบบเบย์บางรูปแบบ ยิ่งไปกว่านั้นโดเมนงานวิจัยต่าง ๆ สร้างความคิดเกี่ยวกับขนาดของเอฟเฟกต์ที่กำหนดในทางปฏิบัติสำหรับดีขึ้นหรือแย่ลงการใช้ฮิวริสติกฉลากเช่น "เล็ก", "ปานกลาง" และ "เอฟเฟ็กต์ขนาดใหญ่" สิ่งนี้ยังนำไปสู่การแนะนำอย่างชาญฉลาดในการเพิ่มขนาดตัวอย่างเพื่อให้ได้ความแม่นยำสูงสุดในการประมาณค่าพารามิเตอร์ที่กำหนด นี่ทำให้ฉันสงสัยว่าทำไมวิธีการที่คล้ายกันโดยยึดตามช่วงความเชื่อมั่นของขนาดเอฟเฟกต์นั้นไม่ได้ดำเนินการอย่างกว้างขวางมากขึ้นในการทดสอบสมมติฐาน คำถาม: อะไรคือดัชนีเดี่ยวที่ดีที่สุดของระดับที่ข้อมูลละเมิดกฎเกณฑ์? หรือเป็นเรื่องที่ดีกว่าถ้าพูดถึงดัชนีการฝ่าฝืนกฎเกณฑ์หลาย ๆ อย่าง (เช่นความเบ้, เคิร์ตซีส, ความแพร่หลายในค่าผิดปกติ) จะคำนวณช่วงความมั่นใจได้อย่างไร (หรืออาจใช้วิธีการแบบเบย์) สำหรับดัชนี? คุณสามารถกำหนดป้ายกำกับด้วยวาจาแบบใดให้กับดัชนีนั้นเพื่อระบุระดับของการละเมิดกฎเกณฑ์ (เช่นอ่อนปานกลางปานกลางแข็งแรงมาก ฯลฯ ) จุดประสงค์ของฉลากดังกล่าวอาจช่วยนักวิเคราะห์ที่มีประสบการณ์น้อยลงในการฝึกอบรมสัญชาตญาณว่าการละเมิดกฎเกณฑ์เป็นปัญหาหรือไม่

1
ฉันสามารถใช้การทดสอบแบบจับคู่เมื่อตัวอย่างแจกตามปกติ แต่ความแตกต่างไม่ได้หรือไม่
ฉันมีข้อมูลจากการทดลองที่ฉันใช้การรักษาสองแบบที่แตกต่างกันในสภาพเริ่มต้นที่เหมือนกันโดยจะสร้างจำนวนเต็มตั้งแต่ 0 ถึง 500 ในแต่ละกรณีเป็นผลลัพธ์ ฉันต้องการใช้การทดสอบแบบจับคู่เพื่อระบุว่าผลที่เกิดจากการรักษาทั้งสองนั้นแตกต่างกันอย่างมีนัยสำคัญหรือไม่ ผลลัพธ์ของแต่ละกลุ่มการรักษาจะกระจายตามปกติ แต่ความแตกต่างระหว่างแต่ละคู่จะไม่ได้รับการแจกแจงตามปกติ (ไม่สมมาตร + หางยาวหนึ่งอัน) ฉันสามารถใช้การทดสอบแบบจับคู่ในกรณีนี้ได้หรือไม่หรือมีการสันนิษฐานว่าละเมิดกฎเกณฑ์ซึ่งหมายความว่าฉันควรใช้การทดสอบแบบไม่อิงพารามิเตอร์ในบางประเภทหรือไม่?

1
Asymptotic normality ของรูปแบบสมการกำลังสอง
Letเป็นเวกเตอร์สุ่มมาจากPพิจารณาตัวอย่างP กำหนดและ^ ปล่อย\ boldsymbol {\ mu}: = \ mathbb {E} _ {\ mathbf {x} \ sim P} [\ mathbf {x}]และC: = \ mathrm {cov} _ {\ mathbf {x} \ sim P} [\ mathbf {x} \ mathbf {x}]xx\mathbf{x}PPP{xi}ni=1∼i.i.d.P{xi}i=1n∼i.i.d.P\{ \mathbf{x}_i \}_{i=1}^n \stackrel{i.i.d.}{\sim} Px¯n:=1n∑ni=1xix¯n:=1n∑i=1nxi\bar{\mathbf{x}}_n := \frac{1}{n} \sum_{i=1}^n \mathbf{x}_iC^:=1n∑ni=1(xi−x¯n)(xi−x¯n)⊤C^:=1n∑i=1n(xi−x¯n)(xi−x¯n)⊤\hat{C} := \frac{1}{n} \sum_{i=1}^n (\mathbf{x}_i - …

3
“ กลับกัน” ชาปิโร่ - วิลค์
การทดสอบ Sharipo-Wilk อ้างอิงจากวิกิพีเดียทดสอบสมมติฐานว่าง ( ) "ประชากรจะกระจายตามปกติ"H0H0H_0 ฉันกำลังมองหาการทดสอบคล้ายกันกับ "ประชากรไม่ได้กระจายตามปกติ"H0H0H_0 หลังจากมีการทดสอบฉันต้องการคำนวณเพื่อปฏิเสธที่ระดับนัยสำคัญ iff ; พิสูจน์ให้เห็นว่าประชากรของฉันกระจายตามปกติH 0 α p &lt; αpppH0H0H_0αα\alphap&lt;αp&lt;αp < \alpha โปรดทราบว่าการใช้การทดสอบ Sharipo-Wilk และการยอมรับ iffเป็นวิธีที่ไม่ถูกต้องเนื่องจากมันหมายถึง "เรามีหลักฐานไม่เพียงพอที่จะพิสูจน์ว่า H0 ไม่ได้ถือ" p &gt; αH0H0H_0p&gt;αp&gt;αp > \alpha หัวข้อที่เกี่ยวข้อง - ความหมายของ -valueppp , เป็นปกติทดสอบไร้ประโยชน์? แต่ฉันไม่เห็นวิธีแก้ไขปัญหาของฉัน คำถาม:ฉันควรใช้แบบทดสอบใด? มันนำมาใช้ใน R หรือไม่?

2
หากฮิสโตแกรมของฉันแสดงเส้นโค้งรูประฆังฉันสามารถพูดได้ว่าข้อมูลของฉันได้รับการกระจายตามปกติ?
ฉันสร้างฮิสโตแกรมสำหรับอายุผู้ตอบและจัดการเพื่อให้ได้เส้นโค้งรูประฆังที่ดีมากจากการที่ฉันสรุปว่าการแจกแจงเป็นเรื่องปกติ จากนั้นฉันรันการทดสอบเชิงปกติใน SPSS โดยมีn = 169 การทดสอบp -value (Sig.) ของการทดสอบ Kolmogorov-Smirnov น้อยกว่า 0.05 และดังนั้นข้อมูลจึงละเมิดสมมติฐานของภาวะปกติ ทำไมการทดสอบแสดงว่าการกระจายอายุไม่ปกติ แต่ฮิสโตแกรมแสดงเส้นโค้งรูประฆังซึ่งจากความเข้าใจของฉันเป็นเรื่องปกติ ฉันควรทำตามผลลัพธ์ใด

5
การทดสอบสมมติฐานเชิงบรรทัดฐานสำหรับมาตรการ anova ซ้ำแล้วซ้ำอีก? (ใน R)
ดังนั้นสมมติว่ามีจุดหนึ่งในการทดสอบเกณฑ์ปกติของโนวา (ดู1และ2 ) มันสามารถทดสอบใน R ได้อย่างไร? ฉันคาดหวังว่าจะทำสิ่งที่ชอบ: ## From Venables and Ripley (2002) p.165. utils::data(npk, package="MASS") npk.aovE &lt;- aov(yield ~ N*P*K + Error(block), npk) residuals(npk.aovE) qqnorm(residuals(npk.aov)) ซึ่งไม่ได้ผลเนื่องจาก "ส่วนที่เหลือ" ไม่มีวิธี (หรือคาดการณ์สำหรับเรื่องนั้น) สำหรับกรณีของมาตรการโนวาซ้ำ ๆ ดังนั้นสิ่งที่ควรทำในกรณีนี้? สามารถดึงสารตกค้างจากแบบจำลองแบบเดียวกันโดยไม่มีเงื่อนไขข้อผิดพลาดได้หรือไม่? ฉันไม่คุ้นเคยกับวรรณกรรมเพียงพอที่จะรู้ว่าสิ่งนี้ถูกต้องหรือไม่ขอบคุณล่วงหน้าสำหรับคำแนะนำใด ๆ

1
เหตุใดข้อผิดพลาดที่ไม่ได้กระจายทั่วไปทำให้ความถูกต้องของข้อความสำคัญของเราไม่เป็นจริง
มีการสันนิษฐานว่าเป็นเรื่องปกติเมื่อพิจารณารูปแบบของ OLS และนั่นคือข้อผิดพลาดที่ได้รับการกระจายตามปกติ ฉันเรียกดูผ่านการตรวจสอบข้ามและดูเหมือนว่า Y และ X ไม่จำเป็นต้องเป็นปกติเพื่อให้ข้อผิดพลาดเป็นปกติ คำถามของฉันคือสาเหตุที่เมื่อเรามีข้อผิดพลาดที่ไม่ได้กระจายทั่วไปความถูกต้องของข้อความสำคัญของเราถูกบุกรุก ทำไมช่วงความมั่นใจจะกว้างหรือแคบเกินไป

5
การแปลง normalizing อื่นใดที่ใช้กันทั่วไปนอกเหนือจากที่พบโดยทั่วไปเช่นสแควร์รูท, บันทึกเป็นต้น
ในการวิเคราะห์คะแนนการทดสอบ (เช่นในด้านการศึกษาหรือจิตวิทยา) เทคนิคการวิเคราะห์ทั่วไปมักจะสมมติว่ามีการแจกจ่ายข้อมูลตามปกติ อย่างไรก็ตามอาจบ่อยกว่าไม่ได้คะแนนมีแนวโน้มที่จะเบี่ยงเบนบางครั้งอย่างรุนแรงจากปกติ ฉันคุ้นเคยกับการแปลง normalizing พื้นฐานบางอย่างเช่น: สแควร์รูท, ลอการิทึม, การแปลงส่วนกลับเพื่อลดความเบ้เป็นบวก, เวอร์ชันที่สะท้อนข้างต้นสำหรับการลดความเบ้เชิงลบ, กำลังสองสำหรับการกระจายเลป ฉันเคยได้ยินเรื่องการแปลงอาร์ซีนและการแปลงพลังงานแม้ว่าฉันจะไม่ค่อยมีความรู้เกี่ยวกับมัน ดังนั้นฉันอยากรู้ว่านักวิเคราะห์ที่ใช้การแปลงแบบอื่นคืออะไร?

1
ข้อผิดพลาดที่กระจายตามปกติและทฤษฎีขีด จำกัด กลาง
ในเศรษฐศาสตรเบื้องต้นของ Wooldridge มีข้อความอ้างอิง: ข้อโต้แย้งที่แสดงให้เห็นถึงการแจกแจงปกติสำหรับข้อผิดพลาดมักจะทำสิ่งนี้: เพราะเป็นผลรวมของปัจจัยที่ไม่ได้สังเกตเห็นหลายอย่างที่มีผลต่อเราจึงสามารถเรียกทฤษฎีบทขีด จำกัด กลางเพื่อสรุปว่ามีการแจกแจงแบบปกติโดยประมาณuuuyyyuuu คำพูดนี้เกี่ยวข้องกับหนึ่งในสมมติฐานโมเดลเชิงเส้นคือ: u∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2) โดยที่uuuคือคำผิดพลาดในตัวแบบประชากร ทีนี้เท่าที่ฉันรู้ทฤษฎีขีด จำกัด กลางระบุว่าการกระจายตัวของ Zi=(Yi¯¯¯¯¯−μ)/(σ/√n)Zi=(Yi¯−μ)/(σ/√n)Z_i=(\overline{Y_i}-μ)/(σ/√n) (โดยที่Yi¯¯¯¯¯Yi¯\overline{Y_i} เป็นค่าเฉลี่ยของกลุ่มตัวอย่างสุ่มจากประชากรใด ๆ ที่มีค่าเฉลี่ยμμμและความแปรปรวนσ2σ2σ^2 ) วิธีการที่ของตัวแปรปกติมาตรฐานn→∞n→∞n \rightarrow \infty\ คำถาม: ช่วยฉันเข้าใจว่ามาตรฐานความเป็นซีมโทติคของZiZiZ_iหมายถึงu∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2)

1
เมื่อใดที่ควรเขียน“ เราถือว่าการแจกแจงแบบปกติ” ของการวัดเชิงประจักษ์?
มันฝังแน่นอยู่ในการสอนวิชาประยุกต์เช่นยาการวัดปริมาณไบโอ - แพทย์ในประชากรตามปกติ "ระฆังโค้ง" การค้นหาสตริง" Google เราถือว่าการแจกแจงแบบปกติ"ของ Google ส่งคืน23 , 90023,900\small 23,900ผล! พวกเขาดูเหมือนว่า"จากจุดข้อมูลจำนวนมากเราคาดว่าจะมีการแจกแจงแบบปกติสำหรับความผิดปกติของอุณหภูมิ"ในการศึกษาเกี่ยวกับการเปลี่ยนแปลงสภาพภูมิอากาศ หรือ"เราสันนิษฐานว่าการแจกจ่ายวันที่ฟักลูกไก่ปกติ"บนเอกสารที่อาจเป็นที่ถกเถียงกันน้อยเกี่ยวกับเพนกวิน หรือ "เราสันนิษฐานว่าการกระจายปกติของ GDP แรงกระแทกการเจริญเติบโต"หมายถึงการเปลี่ยนเศรษฐกิจมหภาคในตลาด (นำขึ้นกับหน่วยความจำหนังสือเล่มนี้ ... และสิ่งอื่น ๆ ) เมื่อเร็ว ๆ นี้ฉันพบว่าตัวเองตั้งคำถามกับการรักษาข้อมูลการนับที่กระจายตามปกติเนื่องจากลักษณะเชิงบวกของพวกเขาอย่างเคร่งครัด แน่นอนว่าการนับข้อมูลนั้นไม่ต่อเนื่องทำให้เป็นเรื่องปกติมากขึ้น แต่ถึงแม้จะทิ้งประเด็นหลังนี้ไว้ทำไมการวัดเชิงประจักษ์อย่างต่อเนื่องเช่นน้ำหนักส่วนสูงหรือความเข้มข้นของกลูโคสซึ่งถือว่าเป็นต้นแบบ "ต่อเนื่อง" ถือว่าเป็นเรื่องปกติ พวกเขาไม่สามารถสังเกตการรับรู้เชิงลบได้มากกว่าการนับ! ฉันเข้าใจว่าเมื่อค่าเบี่ยงเบนมาตรฐานต่ำกว่าค่าเฉลี่ยแสดงค่าลบเล็กน้อย ("การตรวจสอบช่วง 95%") อาจเป็นข้อสมมติที่ใช้งานได้จริงและฮิสโทแกรมความถี่อาจรองรับหากไม่เบ้จนเกินไป แต่คำถามดูเหมือนจะไม่สำคัญและการค้นหาอย่างรวดเร็วให้สิ่งที่น่าสนใจ ในธรรมชาติเราสามารถค้นหาข้อความต่อไปนี้บนจดหมายจาก DF Heath : "ฉันต้องการชี้ให้เห็นว่าสำหรับการวิเคราะห์ทางสถิติของข้อมูลบางประเภทการสันนิษฐานว่าข้อมูลนั้นมาจากประชากรปกติมักจะผิดและทางเลือกอื่น ข้อสันนิษฐานของการกระจายล็อกปกติดีกว่าทางเลือกนี้ใช้กันอย่างแพร่หลายโดยนักสถิตินักเศรษฐศาสตร์และนักฟิสิกส์ แต่ด้วยเหตุผลบางอย่างมักจะถูกละเว้นโดยนักวิทยาศาสตร์ของสาขาอื่น ๆ " Limpert ตั้งข้อสังเกตว่า"แบบจำลองการบันทึกปกติอาจทำหน้าที่เป็นค่าประมาณในแง่ที่ว่านักวิทยาศาสตร์หลายคนรับรู้ปกติว่าเป็นการประมาณที่ถูกต้องในขณะนี้"ในขณะที่สังเกตการใช้พลังงานต่ำของการทดสอบแบบปกติที่ดี การกระจายที่ถูกต้องชัดเจนเมื่อต้องจัดการกับตัวอย่างเล็ก ๆ ดังนั้นคำถามคือ"เมื่อไหร่ที่จะยอมรับการกระจายตัวปกติของการวัดเชิงประจักษ์ในวิทยาศาสตร์ประยุกต์ที่ไม่มีหลักฐานสนับสนุนเพิ่มเติม?" …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.