คำถามติดแท็ก chi-squared

การทดสอบ (โดยทั่วไปคือการกระจายความเป็นอิสระหรือความเหมาะสม) หรือตระกูลของการแจกแจงที่เกี่ยวข้องกับการทดสอบดังกล่าว

1
ทำไมการกระจายตัวตัวอย่างของความแปรปรวนเป็นการแจกแจงแบบไคสแควร์
คำสั่ง การแจกแจงตัวอย่างของความแปรปรวนตัวอย่างคือการแจกแจงแบบไคสแควร์ที่มีระดับความเป็นอิสระเท่ากับโดยที่คือขนาดตัวอย่าง (เนื่องจากตัวแปรสุ่มที่น่าสนใจกระจายอยู่ตามปกติ)n−1n−1n-1nnn แหล่ง สัญชาตญาณของฉัน มันค่อนข้างสมเหตุสมผลกับฉัน 1) เพราะการทดสอบไคสแควร์ดูเหมือนผลรวมของสแควร์และ 2) เพราะการแจกแจงแบบไคสแควร์เป็นเพียงผลรวมของการแจกแจงแบบปกติกำลังสอง แต่ถึงกระนั้นฉันไม่เข้าใจมัน คำถาม คำพูดนั้นเป็นจริงหรือไม่? ทำไม?

2
ผลรวมของตัวแปรสุ่มไคสแควร์ที่ไม่ใช่ศูนย์กลาง
ฉันต้องการค้นหาการกระจายตัวของตัวแปรสุ่ม Y= ∑i = 1n( Xผม)2Y=Σผม=1n(Xผม)2Y=\sum_{i=1}^{n}(X_i)^2 โดยที่Xผม∼ N( μผม, σ2ผม)Xผม~ยังไม่มีข้อความ(μผม,σผม2)X_i\sim{\cal{N}}(\mu_i,\sigma^2_i)และXผมXผมX_i s ทั้งหมดเป็นอิสระ ฉันรู้ว่ามันเป็นไปได้ที่จะหาผลิตภัณฑ์ของทุกช่วงเวลาที่สร้างฟังก์ชั่นสำหรับและจากนั้นแปลงกลับเพื่อให้ได้การแจกแจงของอย่างไรก็ตามฉันสงสัยว่ามีรูปแบบทั่วไปสำหรับ YXผมXผมX_iYYYYYY เช่นกรณี Gaussian: เรารู้ว่าผลรวมของ Gaussian อิสระยังคงเป็น Gaussian และดังนั้นเราจำเป็นต้องทราบค่าเฉลี่ยและความแปรปรวนสรุป วิธีการเกี่ยวกับทุก ? เงื่อนไขนี้จะทำให้การแก้ปัญหาทั่วไป?σ2ผม= σ2σผม2=σ2\sigma^2_i=\sigma^2

3
ผลรวมของผลต่างกำลังสอง t คืออะไร?
ปล่อยให้ถูกดึงออกมาจากการแจกแจงของนักเรียนโดยมีองศาอิสระสำหรับขนาดปานกลาง(พูดน้อยกว่า 100) กำหนด คือกระจายเกือบเป็นไคสแควร์กับองศาอิสระ? มีทฤษฎีบท จำกัด กลางสำหรับผลรวมของตัวแปรสุ่มกำลังสองหรือไม่?เสื้อผมtit_innnnnnT= ∑1 ≤ ฉัน≤ kเสื้อ2ผมT=∑1≤i≤kti2T = \sum_{1\le i \le k} t_i^2TTTkkk

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

1
ฉันจะค้นหาค่าที่ไม่ได้ระบุใน (ตารางสอดแทรก) ในตารางสถิติได้อย่างไร
บ่อยครั้งที่ผู้คนใช้โปรแกรมเพื่อรับค่า p แต่บางครั้งด้วยเหตุผลใดก็ตามอาจจำเป็นต้องได้รับคุณค่าที่สำคัญจากชุดของตาราง ให้ตารางสถิติที่มีระดับนัยสำคัญที่ จำกัด และจำนวนองศาอิสระที่ จำกัด ฉันจะรับค่าวิกฤตที่ระดับความสำคัญอื่น ๆ หรือองศาอิสระได้อย่างไร (เช่นกับตาราง , chi-square หรือ ) ?FtttFFF นั่นคือฉันจะค้นหาค่า "ในระหว่าง" ค่าในตารางได้อย่างไร

4
เปรียบเทียบฮิสโตแกรมสองภาพโดยใช้ระยะทาง Chi-Square
ฉันต้องการเปรียบเทียบภาพใบหน้าสองภาพ ฉันคำนวณ LBP-histograms ของพวกเขา ดังนั้นตอนนี้ฉันต้องเปรียบเทียบฮิสโตแกรมสองตัวนี้และรับบางสิ่งที่จะบอกว่าฮิสโทแกรมเหล่านี้เท่ากัน (0 - 100%) มีหลายวิธีในการแก้ปัญหานี้ แต่ผู้เขียนของวิธี LBP เน้น (คำอธิบายใบหน้าด้วยรูปแบบไบนารีท้องถิ่น: การประยุกต์ใช้การจดจำใบหน้า 2004) ที่ Chi-Square ระยะทางดีกว่าการแยกฮิสโทแกรมและสถิติความน่าจะเป็น ผู้เขียนยังแสดงสูตรของระยะทาง Chi-Square: ∑i=1n(xi−yi)2(xi+yi)∑i=1n(xi−yi)2(xi+yi) \sum_{i=1}^{n} \cfrac{(x_i - y_i)^2} {(x_i + y_i)} โดยที่คือจำนวนของถังขยะคือค่าของถังขยะแรกคือค่าของถังขยะที่สองx i y i innnxixix_iyiyiy_i ในงานวิจัยบางชิ้น (ตัวอย่างเช่นตระกูลระยะทางฮิสโตแกรม Quadratic-Chi) ฉันเห็นว่าสูตรของระยะทาง Chi-Square คือ: 12∑i=1n(xi−yi)2(xi+yi)12∑i=1n(xi−yi)2(xi+yi) \cfrac{1}{2}\sum_{i=1}^{n} \cfrac{(x_i - y_i)^2} {(x_i + y_i)} และมีhttp://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htmฉันเห็นสูตรของระยะทาง Chi-Square นั่นคือ: …

2
ผลกระทบของขอบเขตของถังขยะที่อิงกับข้อมูลต่อความดีของไคสแควร์พอดีหรือไม่
ออกจากประเด็นที่ชัดเจนของพลังงานต่ำของไคสแควร์ในสถานการณ์แบบนี้ลองจินตนาการถึงการทดสอบความดีของไคสแควร์สำหรับความหนาแน่นบางส่วนด้วยพารามิเตอร์ที่ไม่ระบุโดยการทำข้อมูล สำหรับ concreteness สมมุติว่าการแจกแจงเลขชี้กำลังมีค่าเฉลี่ยไม่ทราบและขนาดตัวอย่างเท่ากับ 100 เพื่อให้ได้จำนวนการสังเกตที่คาดหวังต่อ bin จำนวนบัญชีที่เหมาะสมจะต้องมีการบันทึกข้อมูล (เช่นถ้าเราเลือกที่จะวาง 6 bins ต่ำกว่าค่าเฉลี่ยและ 4 ด้านบนนั้นจะยังคงใช้ขอบเขตของฐานข้อมูล) . แต่การใช้ถังขยะโดยดูจากข้อมูลนี้น่าจะส่งผลต่อการแจกแจงสถิติการทดสอบภายใต้ค่า Null ฉันได้เห็นการสนทนามากมายเกี่ยวกับความจริงที่ว่า - หากพารามิเตอร์ถูกประเมินโดยความน่าจะเป็นสูงสุดจากข้อมูลที่ถูกทำให้เป็นบ้าเป็นหลัง - คุณเสีย 1 df ต่อพารามิเตอร์โดยประมาณ (ปัญหาย้อนหลังไปถึง Fisher vs Karl Pearson) - แต่ฉันจำไม่ได้ อ่านอะไรก็ได้เกี่ยวกับการค้นหาขอบเขตของตัวถังขยะเองตามข้อมูล (หากคุณประเมินจากข้อมูลที่ไม่ได้รวมดังนั้นด้วยkkk bins การกระจายของสถิติการทดสอบจะอยู่ที่ไหนสักแห่งระหว่างและ a )χ2kχk2\chi^2_{k}χ2k−pχk−p2\chi^2_{k-p} การเลือกใช้ถังขยะแบบอิงข้อมูลนี้ส่งผลต่อระดับหรือกำลังสำคัญอย่างมีนัยสำคัญหรือไม่? มีวิธีการบางอย่างที่สำคัญกว่าวิธีอื่น ๆ หรือไม่? หากมีผลมากมันเป็นสิ่งที่หายไปในกลุ่มตัวอย่างขนาดใหญ่หรือไม่? ถ้ามันมีผลกระทบที่สำคัญนี่จะทำให้การทดสอบแบบไคสแควร์เกิดขึ้นเมื่อพารามิเตอร์ไม่เป็นที่รู้จักเกือบไร้ประโยชน์ในหลาย ๆ กรณี (แม้ว่าจะยังคงได้รับการสนับสนุนในตำราค่อนข้างน้อย) เว้นแต่คุณจะมี -priori ของพารามิเตอร์ …

1
การทดสอบ Chi Squared ของ Pearson ทำงานอย่างไร
หลังจากลงคะแนนเสียงล่าสุดฉันพยายามตรวจสอบความเข้าใจของฉันเกี่ยวกับการทดสอบ Pearson Chi Squared ฉันมักจะใช้สถิติไคสแควร์ (หรือสถิติไคสแควร์ลดลง) สำหรับการปรับหรือการตรวจสอบแบบที่เกิดขึ้น ในกรณีนี้ความแปรปรวนมักไม่ใช่จำนวนที่คาดหวังในตารางหรือฮิสโตแกรม แต่เป็นความแปรปรวนที่กำหนดโดยการทดลอง ไม่ว่าจะด้วยวิธีใดฉันก็มักจะรู้สึกว่าการทดสอบยังคงใช้มาตรฐานเชิงเส้นกำกับของ Multinomial PDF (เช่นสถิติการทดสอบของฉันคือ Q = ( n - Nม. )⊤V- 1( n - Nม. )Q=(n-ยังไม่มีข้อความม.)⊤V-1(n-ยังไม่มีข้อความม.)Q = (n-Nm)^\top V^{-1}(n-Nm) และเป็นพหุคูณแบบพหุคูณโดยที่คือเมทริกซ์ความแปรปรวนร่วม ดังนั้นมีไคสแควร์จัดจำหน่ายให้มีขนาดใหญ่ดังนั้นการใช้จำนวนที่คาดหวังของการนับเป็นตัวหารในสถิติที่จะกลายเป็นที่ถูกต้องสำหรับขนาดใหญ่nเป็นไปได้ว่าสิ่งนี้เป็นจริงสำหรับฮิสโทแกรมเท่านั้นฉันไม่ได้วิเคราะห์ตารางข้อมูลขนาดเล็กในปีที่ผ่านมาV Q n n( n - Nม. )(n-ยังไม่มีข้อความม.)(n-Nm)VVVQQQnnnnnn มีการโต้แย้งที่ลึกซึ้งยิ่งขึ้นที่ฉันหายไปหรือไม่? ฉันจะสนใจในการอ้างอิงหรือคำอธิบายสั้น ๆ (แม้ว่าจะเป็นไปได้ฉันเพิ่งลงคะแนนให้ละเว้นคำว่า asymptotic ซึ่งฉันยอมรับค่อนข้างสำคัญ)

2
ทำไมการทดสอบไคสแควร์จึงใช้การนับที่คาดหวังเป็นความแปรปรวน
ในการพื้นฐานสำหรับการใช้สแควร์รูทของการนับที่คาดไว้เป็นส่วนเบี่ยงเบนมาตรฐาน (เช่นการนับที่คาดไว้เป็นความแปรปรวน) ของการแจกแจงปกติแต่ละรายการคืออะไร สิ่งเดียวที่ฉันจะได้พูดคุยเกี่ยวกับเรื่องนี้ก็คือhttp://www.physics.csbsju.edu/stats/chi-square.htmlและมันก็กล่าวถึงการแจกแจงปัวซองχ2χ2\chi^2 เป็นตัวอย่างง่ายๆของความสับสนของฉันจะเกิดอะไรขึ้นถ้าเราทดสอบว่ากระบวนการสองอย่างนั้นแตกต่างกันอย่างมากหรือไม่ซึ่งสร้างขึ้นมา 500 As และ 500 Bs ที่มีความแปรปรวนน้อยมากและอีกอันที่สร้าง 550 As และ 450 Bs 551 As และ 449 Bs)? ความแปรปรวนที่นี่ไม่ใช่ค่าที่คาดหวังอย่างชัดเจนไม่ใช่หรือ? (ฉันไม่ใช่นักสถิติดังนั้นกำลังมองหาคำตอบที่ไม่สามารถเข้าถึงได้โดยผู้เชี่ยวชาญ)

1
pdf ของผลิตภัณฑ์ของตัวแปรสุ่มอิสระสองตัวคือปกติและไคสแควร์
pdf ของผลิตภัณฑ์ของตัวแปรสุ่มอิสระ X และ Y คืออะไรหาก X และ Y เป็นอิสระ X คือการแจกแจงแบบปกติและ Y เป็นการแจกแจงแบบไคสแควร์ Z = XY ถ้าXXXมีการแจกแจงปกติX∼N(μx,σ2x)X∼N(μx,σx2)X\sim N(\mu_x,\sigma_x^2) fX(x)=1σx2π−−√e−12(x−μxσx)2fX(x)=1σx2πe−12(x−μxσx)2f_X(x)={1\over\sigma_x\sqrt{2\pi}}e^{-{1\over2}({x-\mu_x\over\sigma_x})^2} และYYYมีการกระจาย Chi-square กับkkkระดับของเสรีภาพ Y∼χ2kY∼χk2Y\sim \chi_k^2 fY(y)=y(k/2)−1e−y/22k/2Γ(k2)u(y)fY(y)=y(k/2)−1e−y/22k/2Γ(k2)u(y)f_Y(y)={y^{(k/2)-1}e^{-y/2}\over{2^{k/2}\Gamma({k\over2})}}u(y) whreu(y)u(y)u(y)เป็นฟังก์ชั่นหน่วยขั้นตอน ทีนี้ pdf ของคืออะไรถ้าXและYเป็นอิสระ?ZZZXXXYYY วิธีหนึ่งในการหาคำตอบคือใช้ผลลัพธ์ที่รู้จักกันดีของ Rohatgi (1976, p.141) หากเป็น pdf ร่วมของXและYของ RV ต่อเนื่อง, ไฟล์ PDF ของZคือ f Z ( z ) = ∫ ∞ …

2
ตารางฉุกเฉิน: การทดสอบจะทำอย่างไรและเมื่อไหร่?
ฉันต้องการที่จะเห็นส่วนขยายของการอภิปรายของการอภิปรายทดสอบไคส์สแควร์และฟิชเชอร์ที่แน่นอนขึ้นโดยขยายขอบเขตออกไปเล็กน้อย มีการทดสอบมากมายสำหรับการโต้ตอบในตารางฉุกเฉินเพียงพอที่จะทำให้หัวของฉันหมุน ฉันหวังว่าจะได้รับคำอธิบายเกี่ยวกับการทดสอบที่ฉันควรใช้และเมื่อใดและแน่นอนว่าคำอธิบายว่าทำไมการทดสอบหนึ่งควรจะดีกว่าอีกการทดสอบหนึ่ง ปัญหาปัจจุบันของฉันคือกรณีคลาสสิกแต่คำตอบเกี่ยวกับมิติที่สูงกว่ายินดีต้อนรับเช่นเดียวกับเคล็ดลับสำหรับการดำเนินการแก้ปัญหาต่าง ๆ ใน R อย่างน้อยในกรณีที่ไม่ชัดเจนว่าจะดำเนินการอย่างไรn × mn×ม.n \times m ด้านล่างนี้เป็นรายการการทดสอบทั้งหมดที่ฉันรู้ ฉันหวังว่าด้วยการเปิดเผยข้อผิดพลาดของฉันพวกเขาสามารถแก้ไขได้ χ2χ2\chi^2 2 เครื่องแสตนด์บายเก่า มีสามตัวเลือกที่สำคัญที่นี่: การแก้ไขที่สร้างขึ้นใน R สำหรับตาราง 2x2: "ครึ่งหนึ่งถูกลบออกจากทั้งหมดความแตกต่าง" ฉันควรทำสิ่งนี้ตลอดเวลาหรือไม่?| O-E||O-E||O-E| การทดสอบ " "ไม่แน่ใจว่าจะทำอย่างไรใน Rยังไม่มีข้อความ- 1ยังไม่มีข้อความ-1N-1χ2χ2\chi^2 การจำลอง Monte Carlo สิ่งนี้ดีที่สุดเสมอหรือ ทำไม R ไม่ให้ df กับฉันเมื่อฉันทำสิ่งนี้? การทดสอบที่แน่นอนฟิชเชอร์ โดยทั่วไปแล้วเมื่อเซลล์ใดคาดว่าจะ <4 แต่เห็นได้ชัดว่ามีข้อโต้แย้งบางอย่างสำหรับคำแนะนำนี้ สมมติฐาน (มักเป็นเท็จ) ว่าระยะขอบได้รับการแก้ไขแล้วเป็นปัญหาที่ใหญ่ที่สุดในการทดสอบนี้หรือไม่? การทดสอบที่แน่นอนของ Barnard การทดสอบอื่นที่แน่นอนยกเว้นฉันไม่เคยได้ยินมาก่อน การถดถอยปัวซอง …

2
เพียร์สันที่เหลือ
คำถามเริ่มต้นเกี่ยวกับส่วนที่เหลือของเพียร์สันในบริบทของการทดสอบไคสแควร์เพื่อความเหมาะสม: เช่นเดียวกับสถิติการทดสอบchisq.testฟังก์ชั่นของ R รายงานส่วนที่เหลือของเพียร์สัน: (obs - exp) / sqrt(exp) ฉันเข้าใจว่าทำไมการดูความแตกต่างที่แท้จริงระหว่างค่าที่สังเกตและค่าที่คาดหวังไม่ใช่ข้อมูลนั้นเนื่องจากตัวอย่างขนาดเล็กจะส่งผลให้เกิดความแตกต่างเล็กน้อย อย่างไรก็ตามฉันต้องการทราบเพิ่มเติมเกี่ยวกับผลกระทบของตัวหาร: ทำไมหารด้วยรากของค่าที่คาดไว้ นี่คือส่วนที่เหลือ 'มาตรฐาน' หรือไม่?

2
การทดสอบหลังการทดสอบสำหรับการทดสอบความดีแบบไคสแควร์
ฉันทำการทดสอบความดีของพอดี (GOF) ของไคสแควร์ด้วยสามประเภทและต้องการทดสอบโมฆะโดยเฉพาะว่าสัดส่วนประชากรในแต่ละหมวดหมู่เท่ากัน (กล่าวคือสัดส่วน 1/3 ในแต่ละกลุ่ม): กลุ่ม ข้อมูล OBSERVED 1 กลุ่ม 2 กลุ่ม 3 รวม 686 928 1012 2626 ดังนั้นสำหรับการทดสอบ GOF นี้การนับที่คาดหวังคือ 2626 (1/3) = 875.333 และการทดสอบให้ค่าp - value ที่สำคัญมากที่<0.0001 ตอนนี้มันชัดเจนว่ากลุ่ม 1 แตกต่างอย่างมากจาก 2 และ 3 และไม่น่าเป็นไปได้ที่ 2 และ 3 จะแตกต่างกันอย่างมีนัยสำคัญ อย่างไรก็ตามถ้าฉันต้องการทดสอบทั้งหมดอย่างเป็นทางการและสามารถให้ค่าpสำหรับแต่ละกรณีวิธีการที่เหมาะสมจะเป็นอย่างไร ฉันค้นหาทั่วออนไลน์และดูเหมือนว่ามีความคิดเห็นที่แตกต่างกัน แต่ไม่มีเอกสารที่เป็นทางการ ฉันสงสัยว่ามีข้อความหรือเอกสารที่ผ่านการตรวจสอบโดยเพื่อนที่ระบุสิ่งนี้ สิ่งที่สมเหตุสมผลสำหรับฉันคือการทดสอบโดยรวมที่สำคัญเพื่อทดสอบzสำหรับความแตกต่างในแต่ละคู่ของสัดส่วนอาจมีการแก้ไขค่า (อาจ Bonferroni เช่น)αα\alpha

1
วิธีการเปรียบเทียบแบบใดที่จะใช้สำหรับโมเดล lmer: lsmeans หรือ glht
ฉันกำลังวิเคราะห์ชุดข้อมูลโดยใช้โมเดลเอฟเฟกต์ผสมกับเอฟเฟ็กต์คงที่หนึ่งรายการ (เงื่อนไข) และเอฟเฟกต์แบบสุ่มสองรายการ (ผู้เข้าร่วมเนื่องจากการออกแบบภายในและคู่ของเรื่อง) รูปแบบที่ถูกสร้างขึ้นด้วยแพคเกจ:lme4exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp) ต่อไปฉันทำการทดสอบอัตราส่วนความน่าจะเป็นของโมเดลนี้เทียบกับโมเดลโดยไม่มีผลกระทบคงที่ (เงื่อนไข) และมีความแตกต่างอย่างมีนัยสำคัญ ชุดข้อมูลของฉันมี 3 เงื่อนไขดังนั้นฉันจึงต้องการเปรียบเทียบหลายรายการ แต่ฉันไม่แน่ใจว่าจะใช้วิธีใด ฉันพบคำถามที่คล้ายกันจำนวนหนึ่งใน CrossValidated และฟอรัมอื่น ๆ แต่ฉันยังสับสนอยู่ จากสิ่งที่ฉันเห็นผู้คนแนะนำให้ใช้ 1.lsmeansแพคเกจ - lsmeans(exp.model,pairwise~condition)ซึ่งทำให้ผมส่งออกต่อไปนี้: condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts …

3
ใช้ glm () แทนการทดสอบไคสแควร์อย่างง่าย
ฉันสนใจที่จะเปลี่ยนสมมติฐานว่างที่ใช้glm()ใน R ตัวอย่างเช่น: x = rbinom(100, 1, .7) summary(glm(x ~ 1, family = "binomial")) การทดสอบสมมติฐานที่ว่า0.5 ถ้าฉันต้องการเปลี่ยนค่า null เป็น = ค่าที่กำหนดเองภายในจะทำอย่างไร p=0.5p=0.5p = 0.5pppglm() ฉันรู้ว่าสิ่งนี้สามารถทำได้ด้วยprop.test()และchisq.test()แต่ฉันต้องการสำรวจความคิดของการใช้glm()เพื่อทดสอบสมมติฐานทั้งหมดที่เกี่ยวข้องกับข้อมูลเด็ดขาด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.