คำถามติดแท็ก model-selection

การเลือกแบบจำลองเป็นปัญหาในการตัดสินว่าแบบจำลองจากชุดใดมีประสิทธิภาพดีที่สุด วิธีการที่นิยม ได้แก่R2เกณฑ์ AIC และ BIC ชุดทดสอบและการตรวจสอบความถูกต้องข้าม การเลือกคุณสมบัติเป็นส่วนย่อยของการเลือกรุ่น

1
Gamma GLM เทียบกับ Log-linked Gaussian GLM เทียบกับ LM-log-แปรรูป LM
จากผลลัพธ์ของฉันปรากฏว่า GLM Gamma เป็นไปตามสมมติฐานส่วนใหญ่ แต่เป็นการปรับปรุงที่คุ้มค่าสำหรับ LM ที่แปลงเป็นไฟล์บันทึกหรือไม่ วรรณกรรมส่วนใหญ่ฉันพบข้อตกลงกับ Poisson หรือ Binomial GLMs ฉันพบว่าบทความการประเมินผลของรูปแบบเชิงเส้นของสมมติฐานทั่วไปโดยใช้การสุ่มคืนค่ามีประโยชน์มาก แต่มันไม่มีแผนการจริงที่ใช้ในการตัดสินใจ หวังว่าคนที่มีประสบการณ์สามารถชี้ฉันในทิศทางที่ถูกต้อง ฉันต้องการสร้างแบบจำลองการกระจายตัวของตัวแปรตอบสนองของฉัน T ซึ่งมีพล็อตแบบกระจาย ที่คุณสามารถดูมันเป็นเบ้บวก: ฉันมีปัจจัยสองอย่างที่ต้องพิจารณา: METH และ CASEPART โปรดทราบว่าการศึกษาครั้งนี้ส่วนใหญ่เป็นการสำรวจโดยมีวัตถุประสงค์หลักเพื่อการศึกษานำร่องก่อนทำการสร้างแบบจำลองเชิงทฤษฎีและทำการแสดง DoE รอบ ๆ ฉันมีโมเดลต่อไปนี้ใน R พร้อมโครงการวินิจฉัย: LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat) GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log')) GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log')) ฉันยังได้รับค่า P ต่อไปนี้ผ่านการทดสอบ Shapiro-Wilks ในส่วนที่เหลือ: LM.LOG: 2.347e-11 GLM.GAMMA: 0.6288 GLM.GAUS: 0.6288 ฉันคำนวณค่า AIC และ BIC แต่ถ้าฉันถูกต้องพวกเขาจะไม่บอกฉันมากนักเนื่องจากตระกูลต่าง ๆ …

1
คุณสามารถเปรียบเทียบค่า AIC ได้หรือไม่หากโมเดลนั้นใช้ชุดข้อมูลเดียวกัน
ฉันกำลังทำการพยากรณ์ใน R โดยใช้แพ็คเกจการพยากรณ์ของ Rob Hyndman กระดาษที่อยู่ในแพคเกจที่สามารถพบได้ที่นี่ ในกระดาษหลังจากอธิบายอัลกอริทึมการพยากรณ์อัตโนมัติผู้เขียนใช้อัลกอริทึมในชุดข้อมูลเดียวกัน อย่างไรก็ตามหลังจากการประเมินทั้งการทำให้เรียบแบบเอ็กซ์โปเนนเชียลและแบบจำลอง ARIMA พวกเขาสร้างข้อความที่ฉันไม่เข้าใจ (หน้า 17): โปรดทราบว่าเกณฑ์ข้อมูลไม่สามารถเปรียบเทียบกันได้ ฉันคิดว่าข้อดีของการใช้ AIC สำหรับการเลือกแบบจำลองคือเราสามารถเปรียบเทียบค่า AIC จากแบบจำลองที่แตกต่างกันได้ตราบใดที่มีการประมาณโดยใช้ชุดข้อมูลเดียวกัน สิ่งนี้ไม่ถูกต้องหรือ เรื่องนี้เป็นเรื่องที่น่าสนใจเป็นพิเศษสำหรับฉันในขณะที่ฉันกำลังวางแผนในการรวมการคาดการณ์จากคลาสรุ่นต่างๆ (เช่นการทำให้เรียบแบบเอกซ์โพเนนเชียลและ ARIMA) โดยใช้ที่เรียกว่าน้ำหนัก Akaike (ดู Burnham and Anderson, 2002) อ้างอิง Burnham, KP, & Anderson, DR (2002) การเลือกรูปแบบและการอนุมานหลายรูปแบบ: วิธีการเชิงทฤษฎีและสารสนเทศ Springer Verlag

1
ข้อกำหนดการโต้ตอบและพหุนามคำสั่งที่สูงขึ้น
หากฉันสนใจในการปรับการปฏิสัมพันธ์แบบสองทางให้เหมาะสมระหว่างตัวแปรอธิบายเชิงเส้นและตัวแปรอธิบายอีกที่มีความสัมพันธ์กำลังสองกับตัวแปรที่ขึ้นอยู่กับฉันจะต้องรวมทั้งการโต้ตอบกับองค์ประกอบกำลังสองและการโต้ตอบกับเส้นตรง องค์ประกอบในรูปแบบ? เช่น ในการสร้างหัวข้อของฉันก่อนหน้านี้: คำศัพท์ความโค้งและการเลือกรูปแบบถ้านี่เป็นการวิเคราะห์การเลือกรูปแบบที่ใช้ใน R โดยมีตัวแปรอธิบายหลายตัว แบบจำลองเอาท์พุทที่มีคำที่ใช้โต้ตอบซึ่งรวมถึงคำกำลังสองaaaขbbYyyY∼ a + b + b2+ a b + a b2y∼a+b+b2+ab+ab2 y\sim a+b+b^2+ab+ab^2 MuMIna : b2a:b2a:b^2จะมีผลถ้าคำปฏิสัมพันธ์กับองค์ประกอบเชิงเส้นมีอยู่ในรูปแบบเดียวกันเช่นเดียวกับa , bและb ^ 2เป็นลักษณะพิเศษโดยตรงหรือไม่a : ba:ba:baaaขbbข2b2b^2

2
เป็นไปได้หรือไม่ที่ AIC และ BIC ให้การเลือกรุ่นที่แตกต่างกันโดยสิ้นเชิง?
ฉันกำลังแสดงแบบจำลองการถดถอยปัวซองด้วย 1 ตัวแปรการตอบสนองและ 6 ตัวแปร การเลือกแบบจำลองโดยใช้ผลลัพธ์ AIC ในแบบจำลองที่มี covariates ทั้งหมดรวมถึง 6 เงื่อนไขการโต้ตอบ อย่างไรก็ตาม BIC ส่งผลให้แบบจำลองมี covariates เพียง 2 ตัวและไม่มีเงื่อนไขการโต้ตอบ เป็นไปได้หรือไม่ที่ทั้งสองเกณฑ์นั้นดูคล้ายกันมากให้ผลการเลือกแบบจำลองต่างกันโดยสิ้นเชิง?

1
การเลือกตัวแปรเทียบกับการเลือกรุ่น
ฉันเข้าใจว่าการเลือกตัวแปรเป็นส่วนหนึ่งของการเลือกแบบจำลอง แต่การเลือกแบบจำลองนั้นประกอบด้วยอะไรบ้าง? มันเป็นมากกว่าต่อไปนี้: 1) เลือกการกระจายสำหรับรุ่นของคุณ 2) เลือกตัวแปรอธิบาย? ฉันถามสิ่งนี้เพราะฉันกำลังอ่านบทความBurnham & Anderson: AIC กับ BICที่พวกเขาพูดคุยเกี่ยวกับ AIC และ BIC ในการเลือกรูปแบบ การอ่านบทความนี้ฉันรู้ว่าฉันกำลังคิดถึง 'การเลือกแบบจำลอง' เป็น 'การเลือกตัวแปร' (อ้างอิงความคิดเห็นBIC พยายามค้นหาแบบจำลองที่แท้จริงหรือไม่ ) ข้อความที่ตัดตอนมาจากบทความที่พวกเขาพูดคุยเกี่ยวกับ 12 รุ่นที่มีระดับ "ทั่วไป" ที่เพิ่มขึ้นและโมเดลเหล่านี้แสดง "เอฟเฟกต์การเรียว" (รูปที่ 1) เมื่อ KL-Information ถูกพล็อตกับ 12 โมเดล: ปรัชญาและรุ่นเป้าหมายที่แตกต่าง ... แม้ว่าเป้าหมายของ BIC จะเป็นรูปแบบทั่วไปมากกว่าแบบเป้าหมายสำหรับ AIC แต่แบบจำลองที่เลือกโดย BIC ส่วนใหญ่มักจะน้อยกว่ารุ่น 7 ยกเว้นว่าnมีขนาดใหญ่มาก มันอาจจะเป็นแบบ 5 …

1
เมื่อใดที่ฉันควรกังวลเกี่ยวกับ Jeffreys-Lindley บุคคลที่ผิดธรรมดาในตัวเลือกแบบจำลอง Bayesian
ฉันกำลังพิจารณาที่มีขนาดใหญ่ ( แต่ จำกัด ) พื้นที่ของรูปแบบที่แตกต่างกันของความซับซ้อนซึ่งผมสำรวจโดยใช้RJMCMC ก่อนหน้าเกี่ยวกับเวกเตอร์พารามิเตอร์สำหรับแต่ละรุ่นมีข้อมูลค่อนข้าง ในกรณีใด (ถ้ามี) ฉันควรกังวลเกี่ยวกับJeffreys-Lindley บุคคลที่ผิดธรรมดานิยมรุ่นที่ง่ายกว่าเมื่อหนึ่งในแบบจำลองที่ซับซ้อนมากขึ้นจะเหมาะสมกว่าหรือไม่ มีตัวอย่างง่ายๆที่เน้นปัญหาของความขัดแย้งในการเลือกตัวแบบเบย์หรือไม่? ฉันได้อ่านบทความไม่กี่ฉบับนั่นคือบล็อกของซีอานและบล็อกของแอนดรูเจลแมนแต่ฉันยังไม่เข้าใจปัญหามากนัก

1
'การทดสอบสมมติฐาน' และ 'การเลือกแบบจำลอง' แตกต่างกันอย่างไร
ในวรรณคดีคำทั้งสองมักจะใช้คำพ้องความหมายหรือ interwoven ตอนนี้ฉันกำลังพยายามหาความแตกต่างที่ชัดเจนระหว่างคำทั้งสอง จากมุมมองของฉันสมมติฐานมักจะแสดงออกผ่านแบบจำลอง ดังนั้นแม้ว่าเราจะทดสอบสมมติฐานว่างกับทางเลือกจากมุมมองของฉันเรากำลังทำการเลือกแบบจำลอง ใครสามารถให้คำอธิบายที่เข้าใจง่ายเกี่ยวกับความแตกต่างนี้ได้?

3
Bayesian vs MLE, ปัญหากำลังเกิดขึ้น
ในหนังสือ PRML ของบิชอปเขากล่าวว่าการให้ข้อมูลมากเกินไปเป็นปัญหากับการประมาณความน่าจะเป็นสูงสุด (MLE) และ Bayesian สามารถหลีกเลี่ยงได้ แต่ฉันคิดว่าการ overfitting เป็นปัญหาเพิ่มเติมเกี่ยวกับการเลือกแบบจำลองไม่ใช่วิธีการที่ใช้ในการประมาณค่าพารามิเตอร์ นั่นคือสมมติว่าฉันมีชุดข้อมูลซึ่งสร้างขึ้นผ่านตอนนี้ฉันอาจเลือกรุ่นที่แตกต่างเพื่อให้พอดีกับข้อมูลและค้นหา อันไหนดีที่สุด และโมเดลที่อยู่ในการพิจารณาคือพหุนามที่มีคำสั่งต่างกันคือคำสั่ง 1,คือคำสั่ง 2,คือคำสั่ง 9DDDf(x)=sin(x),x∈[0,1]f(x)=sin(x),x∈[0,1]f(x)=sin(x),\;x\in[0,1]HiHiH_iH1H1H_1H2H2H_2H3H3H_3 ตอนนี้ผมพยายามที่จะพอดีกับข้อมูลด้วยกัน 3 รุ่นแต่ละรุ่นมีพารามิเตอร์ของตนแสดงเป็นสำหรับH_iDDDwiwiw_iHiHiH_i ใช้ ML ผมจะมีการประมาณการจุดพารามิเตอร์แบบและง่ายเกินไปและจะเสมอ underfit ข้อมูลในขณะที่ซับซ้อนเกินไปและจะ overfit ข้อมูลเพียงจะพอดีกับข้อมูลที่ดีwwwH1H1H_1H3H3H_3H2H2H_2 คำถามของฉันคือ 1) รุ่นจะทำให้ข้อมูลเหมาะสม แต่ฉันไม่คิดว่ามันเป็นปัญหาของ ML แต่เป็นปัญหาของรุ่นต่อ se เนื่องจากการใช้ ML สำหรับจึงไม่ส่งผลให้เกิดการโอเวอร์โหลด ฉันถูกไหม?H3H3H_3H1,H2H1,H2H_1,H_2 2) เมื่อเปรียบเทียบกับ Bayesian แล้ว ML จะมีข้อเสียเนื่องจากมันเพิ่งจะให้ค่าประมาณของพารามิเตอร์แบบจำลองและมันเกินความจริง ในขณะที่ Bayesian ไม่ได้พึ่งเพียงค่าที่เป็นไปได้มากที่สุดของพารามิเตอร์ แต่ค่าที่เป็นไปได้ทั้งหมดของพารามิเตอร์ที่กำหนดจากข้อมูลที่สังเกตใช่ไหม?wwwDDD 3) เหตุใด Bayesian …

1
AIC สำหรับรุ่นที่ไม่ซ้อนกัน: normalizing ค่าคงที่
เอไอซีถูกกำหนดให้เป็นฉันC = - 2 เข้าสู่ระบบ( L ( θ ) ) + 2 Pที่θเป็นประมาณการความน่าจะเป็นสูงสุดและPเป็นมิติของพื้นที่พารามิเตอร์ สำหรับการประมาณθAIC=−2log(L(θ^))+2pAIC=−2log⁡(L(θ^))+2pAIC=-2 \log(L(\hat\theta))+2pθ^θ^\hat\thetapppθθ\thetaมักจะละเลยปัจจัยคงที่ของความหนาแน่น นี่คือปัจจัยที่ไม่ได้ขึ้นอยู่กับพารามิเตอร์เพื่อลดความซับซ้อนของโอกาส ในทางกลับกันปัจจัยนี้มีความสำคัญมากสำหรับการคำนวณ AIC เนื่องจากเมื่อเปรียบเทียบแบบจำลองที่ไม่ซ้อนกันปัจจัยนี้ไม่ธรรมดาและลำดับของ AIC ที่เกี่ยวข้องอาจแตกต่างกันหากไม่ได้พิจารณา คำถามของฉัน , เราจะต้องคำนวณรวมทั้งแง่ของความหนาแน่นเมื่อเปรียบเทียบกับรุ่นที่ไม่ซ้อนกันทั้งหมดหรือไม่log(L(θ^))log⁡(L(θ^))\log(L(\hat\theta))

4
การเลือกรุ่น PCA โดยใช้ AIC (หรือ BIC)
ฉันต้องการใช้ Akaike Information Criterion (AIC) เพื่อเลือกจำนวนปัจจัยที่เหมาะสมในการแยก PCA ปัญหาเดียวคือฉันไม่แน่ใจว่าจะกำหนดจำนวนพารามิเตอร์ได้อย่างไร พิจารณาเมทริกซ์ที่หมายถึงจำนวนของตัวแปรและจำนวนของการสังเกตเช่นว่าขวา) ตั้งแต่เมทริกซ์ความแปรปรวนเป็นสมมาตรแล้วประมาณการความน่าจะเป็นสูงสุดของสามารถกำหนดจำนวนของพารามิเตอร์ใน AIC เท่ากับ{2}X N T X ∼ N ( 0 , Σ ) Σ N ( N + 1 )T×NT×NT\times NXXXNNNTTTX∼N(0,Σ)X∼N(0,Σ)X\sim \mathcal N\left(0,\Sigma\right)ΣΣ\SigmaN(N+1)2N(N+1)2\frac{N\left(N+1\right)}{2} อีกวิธีหนึ่งใน PCA คุณสามารถแยกeigenvectorและค่าลักษณะเฉพาะของแรกเรียกพวกเขาและแล้วคำนวณ โดยที่เป็นความแปรปรวนที่เหลือโดยเฉลี่ย โดยการนับของฉันถ้าคุณมีปัจจัยแล้วคุณจะพารามิเตอร์ใน ,พารามิเตอร์ในและพารามิเตอร์ใน{2}Σ β ฉ Λ ฉ Σ = β ฉ Λ ฉ β ' …

1
ความแตกต่างระหว่าง PROC Mixed และ lme / lmer ใน R - degree of freedom
หมายเหตุ: คำถามนี้เป็นคำถามใหม่เนื่องจากต้องลบคำถามก่อนหน้านี้ด้วยเหตุผลทางกฎหมาย ในขณะที่เปรียบเทียบ PROC MIXED จาก SAS กับฟังก์ชันlmeจากnlmeแพ็คเกจใน R ฉันพบความแตกต่างที่ค่อนข้างสับสน โดยเฉพาะอย่างยิ่งองศาอิสระในการทดสอบที่แตกต่างกันระหว่างPROC MIXEDและlmeและฉันสงสัยว่าทำไม เริ่มจากชุดข้อมูลต่อไปนี้ (รหัส R ระบุด้านล่าง): ind: ปัจจัยบ่งชี้บุคคลที่จะทำการวัด fac: อวัยวะที่ใช้ทำการวัด trt: ปัจจัยบ่งชี้การรักษา y: ตัวแปรตอบสนองต่อเนื่องบางอย่าง ความคิดคือการสร้างแบบจำลองง่ายๆดังต่อไปนี้: y ~ trt + (ind): indเป็นปัจจัยสุ่ม y ~ trt + (fac(ind)): facซ้อนกันindเป็นปัจจัยสุ่ม โปรดทราบว่ารุ่นสุดท้ายที่ควรทำให้เกิดเอกเป็นมีเพียง 1 ค่าของyสำหรับการรวมกันของทุกและindfac แบบจำลองแรก ใน SAS ฉันสร้างโมเดลต่อไปนี้: PROC MIXED data=Data; CLASS ind fac …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
วิธีใช้การวิเคราะห์องค์ประกอบหลักเพื่อเลือกตัวแปรสำหรับการถดถอย
ฉันกำลังใช้การวิเคราะห์องค์ประกอบหลักเพื่อเลือกตัวแปรที่จะใช้ในการสร้างแบบจำลอง ในตอนนี้ฉันทำการวัด A, B และ C ในการทดลองของฉัน - สิ่งที่ฉันอยากรู้คือฉันสามารถทำการวัดน้อยลงและหยุดการบันทึก C และหรือ B เพื่อประหยัดเวลาและความพยายามได้หรือไม่? ฉันพบว่าตัวแปรทั้ง 3 ตัวโหลดอย่างหนักในองค์ประกอบหลักตัวแรกซึ่งคิดเป็น 60% ของความแปรปรวนในข้อมูลของฉัน คะแนนองค์ประกอบบอกฉันว่าถ้าฉันเพิ่มตัวแปรเหล่านี้เข้าด้วยกันในอัตราส่วนที่แน่นอน (aA + bB + cC) ฉันสามารถรับคะแนนบน PC1 สำหรับแต่ละกรณีในชุดข้อมูลของฉันและสามารถใช้คะแนนนี้เป็นตัวแปรในการสร้างแบบจำลอง แต่นั่นไม่อนุญาตให้ฉันหยุดการวัด B และ C ถ้าฉันยกกำลังสองของ A และ B และ C บน PC1 ฉันพบว่าตัวแปร A คิดเป็น 65% ของความแปรปรวนใน PC1 และตัวแปร B คิดเป็น 50% ของความแปรปรวนใน …

1
ทดสอบความเท่าเทียมกันของแบบจำลองที่ไม่ซ้อนกัน
สมมติว่าเป็นฟังก์ชันเชิงเส้นของxและหุ่นd สมมติฐานของฉันอยู่ที่dตัวเองเป็นเหมือนดัชนีประสมของเวกเตอร์ของตัวแปรอื่น ๆ Z ผมได้รับการสนับสนุนในการนี้ในM N O VของZ (เช่นซี1 , ซี2 , ... , Z n ) บนd มีวิธีใดที่จะทดสอบความเท่ากันของโมเดลทั้งสองนี้:yyyxxxddddddZZZMANOVAMANOVAMANOVAZZZz1z1z_1z2z2z_2znznz_nddd รุ่น 1: y=b0+b1⋅x+b2⋅d+e1y=b0+b1⋅x+b2⋅d+e1y = b_0 + b_1 \cdot x + b_2\cdot d + e_1 รุ่น 2: y=g0+Z⋅G+e2y=g0+Z⋅G+e2y = g_0 + Z\cdot G + e_2 โดยที่คือเวกเตอร์คอลัมน์ของพารามิเตอร์GGG

2
GLM หลังจากการเลือกรุ่นหรือการทำให้เป็นมาตรฐาน
ฉันอยากจะถามคำถามนี้ในสองส่วน ทั้งสองจัดการกับโมเดลเชิงเส้นทั่วไป แต่ข้อตกลงแรกกับการเลือกรูปแบบและข้อตกลงอื่น ๆ ที่มีการทำให้เป็นมาตรฐาน ความเป็นมา:ฉันใช้โมเดล GLMs (แบบเชิงเส้นโลจิสติกส์การถดถอยแบบแกมม่า) สำหรับการทำนายและคำอธิบาย เมื่อฉันอ้างถึง " สิ่งปกติที่เกิดขึ้นกับการถดถอย " ฉันหมายถึงคำอธิบายด้วย (i) ช่วงความมั่นใจรอบค่าสัมประสิทธิ์ (ii) ช่วงความเชื่อมั่นรอบการทำนายและ (iii) การทดสอบสมมติฐานเกี่ยวกับการรวมกันเชิงเส้นของสัมประสิทธิ์เช่น " มีความแตกต่างระหว่างการรักษา A และการรักษา B หรือไม่ " คุณสูญเสียความสามารถในการทำสิ่งเหล่านี้อย่างถูกกฎหมายโดยใช้ทฤษฎีปกติภายใต้ข้อใดข้อหนึ่งต่อไปนี้หรือไม่? และถ้าเป็นเช่นนั้นสิ่งเหล่านี้จะดีสำหรับแบบจำลองที่ใช้สำหรับการทำนายที่บริสุทธิ์หรือไม่? I.เมื่อ GLM มีความเหมาะสมผ่านกระบวนการคัดเลือกแบบบางรุ่น (สำหรับรูปสมส่วนบอกขั้นตอนแบบขั้นตอนตาม AIC) ครั้งที่สอง เมื่อ GLM เหมาะสมผ่านวิธีการทำให้เป็นมาตรฐาน (พูดโดยใช้ glmnet ใน R) ความรู้สึกของฉันคือสำหรับฉันคำตอบคือในทางเทคนิคที่คุณควรใช้ bootstrap สำหรับ " สิ่งปกติที่ทำกับการถดถอย " แต่ไม่มีใครปฏิบัติตามนั้น เพิ่ม: …

1
การทดสอบที่แน่นอนของฟิชเชอร์และการกระจาย hypergeometric
ฉันต้องการที่จะเข้าใจการทดสอบที่แม่นยำของฟิชเชอร์มากขึ้นดังนั้นฉันจึงคิดค้นตัวอย่างของเล่นต่อไปนี้โดยที่ f และ m สอดคล้องกับเพศชายและเพศหญิงและ n และ y สอดคล้องกับ "การบริโภคโซดา" เช่นนี้: > soda_gender f m n 0 5 y 5 0 เห็นได้ชัดว่านี่คือการทำให้เข้าใจง่ายมาก แต่ฉันไม่ต้องการให้บริบทเข้ามาขวางทาง ที่นี่ฉันเพิ่งสันนิษฐานว่าผู้ชายไม่ดื่มโซดาและหญิงดื่มโซดาและต้องการดูว่าวิธีการทางสถิติมาถึงข้อสรุปเดียวกัน เมื่อฉันทำการทดสอบฟิชเชอร์ที่แน่นอนใน R ฉันจะได้ผลลัพธ์ต่อไปนี้: > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.