Negative-binomial GLM เทียบกับการเปลี่ยนแปลงการบันทึกสำหรับข้อมูลนับ: เพิ่มอัตราความผิดพลาด Type I


18

คุณบางคนอาจจะอ่านบทความนี้ดี:

O'Hara RB, Kotze DJ (2010) อย่าบันทึกข้อมูลการนับการแปลง วิธีการทางนิเวศวิทยาและวิวัฒนาการ 1: 118–122 Klick

ในสาขาการวิจัยของฉัน (นิเวศน์วิทยา) เรากำลังจัดการกับการทดลองที่ทำซ้ำแบบไม่ดีและ GLM ไม่ได้ใช้กันอย่างแพร่หลาย ดังนั้นฉันจึงทำการจำลองที่คล้ายกันกับ O'Hara & Kotze (2010) แต่เลียนแบบข้อมูลนิเวศน์วิทยา

พลังงานจำลอง :

ฉันจำลองข้อมูลจากการออกแบบแบบแฟกทอเรียลด้วยกลุ่มควบคุมหนึ่งกลุ่ม ( ) และกลุ่มการรักษา 5 กลุ่ม ( ) ความอุดมสมบูรณ์ในการรักษา 1 เหมือนกับการควบคุม ( ) ความอุดมสมบูรณ์ในการรักษา 2-5 คือครึ่งหนึ่งของความอุดมสมบูรณ์ในการควบคุม ( \ mu_ {2-5} = 0.5 \ mu_c ) สำหรับแบบจำลองฉันเปลี่ยนขนาดตัวอย่าง (3,6,9,12) และความอุดมสมบูรณ์ในกลุ่มควบคุม (2, 4, 8, ... , 1024) ความอุดมสมบูรณ์ถูกดึงมาจากการแจกแจงแบบทวินามลบด้วยพารามิเตอร์การกระจายตัวคงที่ ( \ theta = 3.91 ) ชุดข้อมูล 100 ชุดถูกสร้างขึ้นและวิเคราะห์โดยใช้ลบทวินาม GLM และข้อมูลแบบบันทึกการเปลี่ยนแปลงแบบเกาส์ GLM +μcμ15μ1=μcμ25=0.5μcθ=3.91

ผลลัพธ์เป็นไปตามที่คาดไว้: GLM มีพลังอำนาจมากขึ้นโดยเฉพาะอย่างยิ่งเมื่อมีสัตว์ไม่กี่ตัวอย่าง ป้อนคำอธิบายรูปภาพที่นี่ รหัสอยู่ที่นี่

พิมพ์ I Error :

ต่อไปฉันดูข้อผิดพลาดประเภทหนึ่ง ทำการจำลองตามที่กล่าวไว้ข้างต้นอย่างไรก็ตามทุกกลุ่มมีความอุดมสมบูรณ์เหมือนกัน ( μc=μ15 )

อย่างไรก็ตามผลลัพธ์ไม่เป็นไปตามที่คาดไว้: ป้อนคำอธิบายรูปภาพที่นี่ ลบทวินามลบ GLM แสดงข้อผิดพลาด Type-I มากขึ้นเมื่อเทียบกับการแปลง LM + ความแตกต่างหายไปเมื่อเพิ่มขนาดตัวอย่าง รหัสอยู่ที่นี่

คำถาม:

เหตุใดจึงมีข้อผิดพลาด Type-I เพิ่มขึ้นเมื่อเทียบกับการแปลง lm +

หากเรามีข้อมูลที่ไม่ดี (ขนาดตัวอย่างเล็ก ๆ น้อยมากมาย (หลายศูนย์)) เราควรใช้การแปลง lm + หรือไม่? ตัวอย่างขนาดเล็ก (2-4 ต่อการรักษา) เป็นเรื่องปกติสำหรับการทดลองดังกล่าวและไม่สามารถเพิ่มได้ง่าย

ถึงแม้ว่าจะเป็นคนขี้เกียจ ถัง GLM สามารถจัดว่าเหมาะสมสำหรับข้อมูลนี้การแปลง lm + อาจป้องกันเราจากข้อผิดพลาดประเภท 1


1
ไม่ใช่คำตอบสำหรับคำถามหลักของคุณ แต่เป็นสิ่งที่ผู้อ่านควรทราบ: นอกจากว่าคุณทำให้ข้อผิดพลาดประเภท I ที่แท้จริงเทียบเท่ากับสองขั้นตอนการเปรียบเทียบกำลังไฟไม่สมเหตุสมผล ฉันสามารถทำให้พลังงานสูงขึ้นสำหรับอันที่ต่ำกว่าได้เสมอ (ในกรณีนี้ให้บันทึกและใส่แบบปกติ) โดยการยกข้อผิดพลาดประเภทที่ 1 ในทางตรงกันข้ามถ้าคุณระบุสถานการณ์เฉพาะ (ขนาดตัวอย่างความอุดมสมบูรณ์) คุณจะได้รับอัตราความผิดพลาดประเภทที่ 1 (เช่นจากการจำลอง) และเพื่อกำหนดอัตราการทดสอบเพื่อให้ได้อัตราข้อผิดพลาดประเภทที่ต้องการ ดังนั้นพลังงานของพวกเขาจึงเทียบเท่ากัน
Glen_b -Reinstate Monica

ค่าแกน y ในแปลงของคุณเฉลี่ยอยู่ในชุดข้อมูล 100 ชุดหรือไม่?
shadowtalker

ฉันควรอธิบายความคิดเห็นของฉัน: ในกรณีที่สถิติไม่ต่อเนื่องโดยกำเนิดคุณไม่สามารถควบคุมอัตราความผิดพลาดประเภทที่ 1 ได้อย่างสมบูรณ์แบบ แต่โดยทั่วไปคุณสามารถทำให้อัตราความผิดพลาดประเภทที่ 1 ค่อนข้างใกล้เคียงได้ ในสถานการณ์ที่คุณไม่สามารถทำให้พวกเขาอยู่ใกล้กันมากพอที่จะเทียบเคียงกันได้วิธีเดียวที่จะทำให้พวกมันเปรียบได้คือการทดสอบแบบสุ่ม
Glen_b -Reinstate Monica

@ssdecontrol: ไม่มันเป็นเพียงแค่สัดส่วนของชุดข้อมูล (จาก 100) ที่ p <α
EDi

1
มีสองประเด็นคือ (i) คือการที่ใกล้เคียงที่มี asymptotic แต่ไม่ได้ไม่มีที่สิ้นสุดดังนั้นประมาณเป็นเพียงที่ประมาณ - นี้จะเป็นปัญหาว่ามี discreteness หรือไม่และจะนำไปสู่ระดับนัยสำคัญ นอกเหนือจากที่ระบุ (แต่ถ้ามันต่อเนื่องมันเป็นสิ่งที่คุณสามารถปรับได้); (ii) มีปัญหาเรื่องความไม่ลงรอยกันซึ่งทำให้คุณไม่ได้รับระดับความสำคัญที่แน่นอนหากคุณปรับตัว n
Glen_b -Reinstate Monica

คำตอบ:


17

นี่เป็นปัญหาที่น่าสนใจอย่างมาก ฉันตรวจสอบโค้ดของคุณและไม่พบการพิมพ์ผิดที่ชัดเจนในทันที

ฉันต้องการที่จะเห็นคุณทำซ้ำการจำลองนี้ แต่ใช้การทดสอบความน่าจะเป็นสูงสุดเพื่อให้ข้อสรุปเกี่ยวกับความแตกต่างระหว่างกลุ่ม สิ่งนี้จะเกี่ยวข้องกับการดัดแปลงแบบจำลองโมฆะเพื่อให้คุณสามารถประมาณค่าของภายใต้สมมติฐานว่างของความเป็นเนื้อเดียวกันในอัตราระหว่างกลุ่ม ฉันคิดว่ามันเป็นสิ่งที่จำเป็นเพราะตัวแบบทวินามลบนั้นไม่ใช่แบบเชิงเส้น (อัตรานั้นแปรผันเป็นเส้นตรง แต่ s ไม่ใช่) ดังนั้นฉันไม่เชื่อว่าข้อโต้แย้งให้การอนุมานที่ถูกต้องθθdrop1

การทดสอบส่วนใหญ่สำหรับตัวแบบเชิงเส้นไม่ต้องการให้คุณคำนวณแบบจำลองใหม่ภายใต้สมมติฐานว่าง นี่เป็นเพราะคุณสามารถคำนวณความชันเชิงเรขาคณิต (การทดสอบคะแนน) และประมาณความกว้าง (การทดสอบวอลด์) โดยใช้การประมาณค่าพารามิเตอร์และความแปรปรวนร่วมโดยประมาณภายใต้สมมติฐานทางเลือกเพียงอย่างเดียว

เนื่องจากทวินามลบเป็นเส้นตรงฉันคิดว่าคุณจะต้องพอดีกับโมเดลว่าง

แก้ไข:

ฉันแก้ไขรหัสและได้รับต่อไปนี้: ป้อนคำอธิบายรูปภาพที่นี่

แก้ไขโค้ดที่นี่: https://github.com/aomidpanah/simulations/blob/master/negativeBinomialML.r


แต่ผมคิดว่าdrop1() ไม่ภายในใหม่เหมาะสมกับรูปแบบโมฆะ ...
เบน Bolker

4
glm.nbθdrop1logLikgetS3method('logLik', 'negbin'

ต้องการ +1 อีกครั้ง แต่ฉันทำไม่ได้ ดี
Ben Bolker

ขอบคุณ! ฉันเพียงแค่มองรหัสของทั้งสองและdrop1() lrtest()คุณพูดถูกการdrop1.glmใช้งานglm.fitที่ผิดไป ไม่ทราบว่าเราไม่สามารถใช้drop1()กับglm.nb()!
EDi

ดังนั้นคะแนนทั่วไปและการทดสอบ Wald นั้นไม่ถูกต้องในรูปแบบทวินามลบ
shadowtalker

8

กระดาษ O'Hara และ Kotze (วิธีการทางนิเวศวิทยาและวิวัฒนาการ 1: 118–122) ไม่ใช่จุดเริ่มต้นที่ดีสำหรับการอภิปราย ข้อกังวลที่ร้ายแรงที่สุดของฉันคือการอ้างสิทธิ์ในจุดที่ 4 ของการสรุป:

เราพบว่าการแปลงรูปแบบนั้นทำได้ไม่ดียกเว้น . .. โมเดลกึ่งปัวซองและโมเดลทวินามลบ ... [แสดง] อคติเล็กน้อย

λθλ

λ

รหัส R ต่อไปนี้แสดงให้เห็นถึงจุด:

x <- rnbinom(10000, 0.5, mu=2)  
## NB: Above, this 'mu' was our lambda. Confusing, is'nt it?
log(mean(x+1))
[1] 1.09631
log(2+1)  ## Check that this is about right
[1] 1.098612

mean(log(x+1))
[1] 0.7317908

หรือลอง

log(mean(x+.5))
[1] 0.9135269
mean(log(x+.5))
[1] 0.3270837

สเกลที่พารามิเตอร์มีการประมาณนั้นสำคัญมาก!

λ

โปรดทราบว่าการวินิจฉัยมาตรฐานจะทำงานได้ดีขึ้นในระดับของบันทึก (x + c) ตัวเลือกของ c อาจไม่สำคัญเกินไป บ่อยครั้งที่ 0.5 หรือ 1.0 เหมาะสม นอกจากนี้ยังเป็นจุดเริ่มต้นที่ดีกว่าสำหรับการตรวจสอบการแปลง Box-Cox หรือตัวแปร Yeo-Johnson ของ Box-Cox [Yeo, I. และ Johnson, R. (2000)] ดูหน้าช่วยเหลือเพิ่มเติมสำหรับ powerTransform () ในแพ็คเกจรถยนต์ของ R แพ็คเกจ gamlss ของ R ทำให้สามารถติดตั้ง binomial ประเภท I เชิงลบ (ความหลากหลายทั่วไป) หรือ II หรือการกระจายอื่น ๆ ที่จำลองการกระจายตัวรวมถึงค่าเฉลี่ยด้วยลิงก์การแปลงพลังงานของ 0 (= บันทึกคือลิงก์บันทึก) หรือมากกว่า . อาจจะไม่เข้ากันพอดี

ตัวอย่าง: ข้อมูลการเสียชีวิตเทียบกับความเสียหายพื้นฐาน มีไว้สำหรับพายุเฮอริเคนในมหาสมุทรแอตแลนติกที่มีชื่อว่า ข้อมูลมีอยู่ (ชื่อhurricNamed ) จากแพคเกจ DAAG รุ่นล่าสุดสำหรับ R หน้าความช่วยเหลือสำหรับข้อมูลมีรายละเอียด

loglinear ที่แข็งแกร่งเทียบกับแบบทวินามลบ

กราฟเปรียบเทียบเส้นประกอบที่ได้รับโดยใช้ตัวแบบเชิงเส้นที่มีความแข็งแรงโดยมีส่วนโค้งที่ได้จากการแปลงความพอดีแบบทวินามลบด้วยการเชื่อมโยงการบันทึกลงในมาตราส่วนการบันทึก (นับ + 1) ที่ใช้สำหรับแกน y บนกราฟ (โปรดทราบว่าเราต้องใช้บางสิ่งบางอย่างที่คล้ายกับมาตราส่วนบันทึก (นับ + c) ด้วยค่าบวกเพื่อแสดงคะแนนและ "เส้น" ที่พอดีจากลบทวินามแบบพอดีในกราฟเดียวกัน) หมายเหตุอคติขนาดใหญ่ที่ ชัดเจนสำหรับขนาดทวินามลบในระดับบันทึก แบบจำลองเชิงเส้นที่มีความทนทานนั้นมีความเอนเอียงน้อยกว่ามากในระดับนี้หากมีการสันนิษฐานว่ามีการแจกแจงแบบทวินามลบสำหรับการนับ แบบจำลองเชิงเส้นจะไม่ลำเอียงภายใต้สมมติฐานทฤษฎีคลาสสิกปกติ ฉันพบอคติที่น่าประหลาดใจเมื่อฉันสร้างครั้งแรกสิ่งที่เป็นกราฟด้านบน! เส้นโค้งจะพอดีกับข้อมูลที่ดีกว่า แต่ความแตกต่างอยู่ภายในขอบเขตของมาตรฐานปกติของความแปรปรวนทางสถิติ แบบจำลองเชิงเส้นที่มีความทนทานนั้นทำงานได้ไม่ดีสำหรับการนับที่ระดับต่ำสุดของเครื่องชั่ง

หมายเหตุ --- การศึกษากับข้อมูล RNA-Seq:การเปรียบเทียบทั้งสองรูปแบบของแบบจำลองได้รับความสนใจในการวิเคราะห์ข้อมูลนับจากการทดลองการแสดงออกของยีน บทความต่อไปนี้เปรียบเทียบการใช้โมเดลเชิงเส้นที่มีประสิทธิภาพการทำงานกับบันทึก (นับ + 1) กับการใช้ทวินามลบที่พอดี (เช่นเดียวกับในแพคเกจ Bioconductor edgeR ) การนับส่วนใหญ่ในแอปพลิเคชัน RNA-Seq ที่เป็นหลักในใจมีขนาดใหญ่พอที่โมเดลการบันทึกเชิงเส้นที่มีน้ำหนักที่เหมาะสมจะทำงานได้ดีมาก

กฎหมาย, CW, เฉิน, Y, Shi, W, Smyth, GK (2014) Voom: ตุ้มน้ำหนักที่แม่นยำปลดล็อคเครื่องมือวิเคราะห์แบบจำลองเชิงเส้นสำหรับจำนวนการอ่าน RNA-seq ชีววิทยาจีโนม 15, R29 http://genomebiology.com/2014/15/2/R29

NB ยังกระดาษล่าสุด:

Schurch NJ, Schofield P, Gierliński M, Cole C, Sherstnev A, Singh V, Wrobel N, Gharbi K, Simpson GG, โอเว่น - ฮิวจ์ T, Blaxter M, Barton GJ (2016) มีการจำลองแบบทางชีวภาพจำนวนเท่าไรในการทดลอง RNA-seq และเครื่องมือนิพจน์ส่วนต่างที่คุณควรใช้ RNA http://www.rnajournal.org/cgi/doi/10.1261/rna.053959.115

เป็นที่น่าสนใจที่โมเดลเชิงเส้นเหมาะสมกับการใช้แพ็คเกจlimma (เช่นedgeRจากกลุ่ม WEHI) ดีขึ้นอย่างมาก (ในแง่ของการแสดงหลักฐานเล็กน้อยของอคติ) เทียบกับผลลัพธ์ที่มีจำนวนซ้ำจำนวนมาก ที่ลดลง.

รหัส R สำหรับกราฟด้านบน:

library(latticeExtra, quietly=TRUE)
hurricNamed <- DAAG::hurricNamed
ytxt <- c(0, 1, 3, 10, 30, 100, 300, 1000)
xtxt <- c(1,10, 100, 1000, 10000, 100000, 1000000 )
funy <- function(y)log(y+1)
gph <- xyplot(funy(deaths) ~ log(BaseDam2014), groups= mf, data=hurricNamed,
   scales=list(y=list(at=funy(ytxt), labels=paste(ytxt)),
           x=list(at=log(xtxt), labels=paste(xtxt))),
   xlab = "Base Damage (millions of 2014 US$); log transformed scale",
   ylab="Deaths; log transformed; offset=1",
   auto.key=list(columns=2),
   par.settings=simpleTheme(col=c("red","blue"), pch=16))
gph2 <- gph + layer(panel.text(x[c(13,84)], y[c(13,84)],
           labels=hurricNamed[c(13,84), "Name"], pos=3,
           col="gray30", cex=0.8),
        panel.text(x[c(13,84)], y[c(13,84)],
           labels=hurricNamed[c(13,84), "Year"], pos=1, 
           col="gray30", cex=0.8))
ab <- coef(MASS::rlm(funy(deaths) ~ log(BaseDam2014), data=hurricNamed))

gph3 <- gph2+layer(panel.abline(ab[1], b=ab[2], col="gray30", alpha=0.4))
## 100 points that are evenly spread on a log(BaseDam2014) scale
x <- with(hurricNamed, pretty(log(BaseDam2014),100))
df <- data.frame(BaseDam2014=exp(x[x>0])) 
hurr.nb <- MASS::glm.nb(deaths~log(BaseDam2014), data=hurricNamed[-c(13,84),])
df[,'hatnb'] <- funy(predict(hurr.nb, newdata=df, type='response'))
gph3 + latticeExtra::layer(data=df,
       panel.lines(log(BaseDam2014), hatnb, lwd=2, lty=2, 
           alpha=0.5, col="gray30"))    

2
ขอบคุณสำหรับความคิดเห็นของคุณ Mr. Maindonald ในช่วงสองปีที่ผ่านมามีเอกสารอีกจำนวนหนึ่ง (มุ่งเน้นไปที่การทดสอบสมมติฐานจากนั้นมีอคติ): Ives 2015, Warton et al 2016, Szöcs 2015
EDi

อาจเป็นจุดเริ่มต้นที่ดีสำหรับการสนทนาแม้ว่าจุดนี้จะเป็นปัญหาหรือไม่ (ฉันจะเถียงมากกว่าปกติว่านี่คือเหตุผลที่จะไม่ให้ความสนใจกับอคติมากเกินไป แต่ให้พิจารณาบางอย่างเช่น RMSE ... [ข้อจำกัดความรับผิดชอบฉันไม่ได้อ่านเอกสารเหล่านี้เมื่อเร็ว ๆ นี้และฉันได้อ่านนามธรรมของ กระดาษของ Warton ... ]
Ben Bolker

1
จุดของ Warton et al (2016) ว่าคุณสมบัติของข้อมูลควรเป็นเหตุผลสำหรับการเลือกเป็นสิ่งสำคัญ แปลงควอนไทล์ควอนไทล์เป็นวิธีที่ดีในการเปรียบเทียบรายละเอียดของความพอดี โดยเฉพาะอย่างยิ่งพอดีที่หนึ่งหรืออื่น ๆ หรือทั้งสองขั้วอาจมีความสำคัญสำหรับการใช้งานบางอย่าง แบบจำลองที่ไม่มีการพองลมหรือสิ่งกีดขวางสามารถช่วยให้การนับมีค่าถูกต้อง ที่ส่วนบนสุดของแบบจำลองใด ๆ ภายใต้การสนทนาอาจถูกทำลายอย่างรุนแรง Warton et al do น่ายกย่องมีตัวอย่างหนึ่ง ฉันต้องการดูการเปรียบเทียบในชุดข้อมูลระบบนิเวศที่หลากหลาย
John Maindonald

แต่ไม่ได้อยู่ในชุดข้อมูลระบบนิเวศสายพันธุ์ในส่วนล่าง (= สายพันธุ์หายาก) ที่น่าสนใจ? ไม่ควรจะยากเกินไปที่จะรวบรวมชุดข้อมูลเชิงนิเวศวิทยาและเปรียบเทียบ ...
EDI

ที่จริงแล้วมันเป็นจุดต่ำสุดของหมวดความเสียหายที่แบบจำลองทวินามลบนั้นดูเหมือนว่าสำหรับข้อมูลการตายของพายุเฮอริเคน แพ็คเกจgamlssของ R มีฟังก์ชั่นที่ทำให้ง่ายต่อการเปรียบเทียบ centiles ของการกระจายที่พอดีกับ centiles ของข้อมูล:
John Maindonald

6

โพสต์ต้นฉบับสะท้อนให้เห็นถึงโทนี่อีฟส์กระดาษ: อีฟส์ (2015) เป็นที่ชัดเจนว่าการทดสอบความสำคัญให้ผลลัพธ์ที่แตกต่างกับการประมาณพารามิเตอร์

John Maindonald อธิบายว่าทำไมการประเมินจึงลำเอียง แต่ความไม่รู้เบื้องหลังของเขานั้นน่ารำคาญ - เขาวิพากษ์วิจารณ์เราเพราะแสดงให้เห็นว่าวิธีการที่เราทุกคนเห็นว่ามีข้อบกพร่องนั้นมีข้อบกพร่อง นักนิเวศวิทยาจำนวนมากทำการเปลี่ยนแปลงอย่างสุ่มสี่สุ่มห้าและเราพยายามชี้ให้เห็นปัญหาที่เกิดขึ้น

มีการสนทนาที่เหมาะสมยิ่งขึ้นที่นี่: Warton (2016)

Ives, AR (2015), สำหรับการทดสอบความสำคัญของค่าสัมประสิทธิ์การถดถอยไปข้างหน้าและข้อมูลนับการแปลงเข้าสู่ระบบ วิธีการ Ecol Evol, 6: 828–835 ดอย: 10.1111 / 2041-210X.12386

Warton, DI, Lyons, M. , Stoklosa, J. และ Ives, AR (2016), สามคะแนนที่ควรพิจารณาเมื่อเลือกการทดสอบ LM หรือ GLM สำหรับข้อมูลนับ วิธีการ Ecol Evol ดอย: 10.1111 / 2041-210X.12552


ยินดีต้อนรับสู่ประวัติย่อ ในขณะที่มีประโยชน์การตอบสนองนี้ส่วนใหญ่เป็นคำตอบประเภท "ลิงก์เท่านั้น" ลิงก์ทำการเปลี่ยนแปลงและยกเลิกการเชื่อมโยง มันจะมีประโยชน์มากขึ้นสำหรับ CV ถ้าคุณจะอธิบายรายละเอียดในประเด็นสำคัญในแต่ละข้อ
Mike Hunter

ขอบคุณสำหรับคำตอบ ฉันคิดว่ากระดาษของ Warton และคณะ เหรียญสถานะปัจจุบันของการสนทนา
EDi

ขอขอบคุณและยินดีต้อนรับ! ฉันได้เพิ่มเสรีภาพในการเพิ่มการอ้างอิงแบบเต็ม
Scortchi - Reinstate Monica

1
โปรดระบุประเด็นหลักที่เกิดขึ้นในเอกสารอ้างอิงใหม่และที่ที่เหมาะสมโปรดเชื่อมโยงประเด็นเหล่านั้นกลับไปที่คำถามเดิม นี่คือการสนับสนุนที่มีคุณค่า แต่ในปัจจุบันใกล้ความคิดเห็นในคำตอบอื่นมากกว่าคำตอบสำหรับคำถาม (ซึ่งควรมีบริบทสำหรับลิงค์เช่น) บริบทเพิ่มเติมเล็กน้อยจะช่วยให้การโพสต์เป็นกอบเป็นกำ
Glen_b -Reinstate Monica

3
โดยเฉพาะอย่างยิ่งความคิดเห็นของฉันชี้ไปที่จุดที่ 4 ในกระดาษ O'Hara และ Kotze: "เราพบว่าการแปลงรูปแบบนั้นทำได้ไม่ดียกเว้น .. .. รูปแบบกึ่ง Po Po Poise และรูปแบบทวินามลบ ... การจำลองเป็นการแสดงความคิดเห็นในการเปรียบเทียบระหว่างค่าเฉลี่ยที่คาดหวังในระดับ y (ค่า) เมื่อเทียบกับค่าเฉลี่ยที่คาดหวังในระดับของบันทึก (y + c) สำหรับการแจกแจงแบบเอียงเชิงบวกไม่มีอะไรเพิ่มเติม แลมบ์ดาพารามิเตอร์ลบแบบทวินามนั้นไม่เอนเอียงกับสเกลของ y ในขณะที่ค่าเฉลี่ยล็อก - ปกติจะไม่เอนเอียง (ภายใต้ค่าปกติในสเกลนั้น) ในสเกลของบันทึก (y + c)
John Maindonald
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.