คำถามติดแท็ก model

ความสัมพันธ์ระหว่างตัวแปรที่เกี่ยวข้องกับการสุ่มอย่างเป็นทางการ (สุ่ม) ในรูปแบบของสมการทางคณิตศาสตร์ อย่าใช้แท็กนี้ด้วยตัวเอง: ควรรวมแท็กที่เฉพาะเจาะจงมากกว่าเสมอ

7
ต้องจ่ายเท่าไหร่ ปัญหาในทางปฏิบัติ
นี่ไม่ใช่คำถามทำงานที่บ้าน แต่ปัญหาที่แท้จริงของ บริษัท ของเรา เมื่อเร็ว ๆ นี้ (2 วันที่ผ่านมา) เราสั่งให้ผลิตฉลากผลิตภัณฑ์ 10,000 รายการให้กับตัวแทนจำหน่าย ตัวแทนจำหน่ายเป็นบุคคลที่เป็นอิสระ เขาได้รับฉลากที่ผลิตจากภายนอกและ บริษัท ชำระเงินให้กับตัวแทนจำหน่าย ป้ายกำกับแต่ละรายการมีราคาเท่ากับ $ 1 ถึง บริษัท เมื่อวานนี้ดีลเลอร์มาพร้อมกับฉลาก แต่มีการรวมฉลากในแพ็คเก็ตละ 100 ป้าย ด้วยวิธีนี้มี 100 แพ็กเก็ตและแต่ละแพ็คเก็ตมี 100 ป้ายดังนั้นรวม 10,000 ป้าย ก่อนที่จะชำระเงินให้กับตัวแทนจำหน่ายของ $ 10,000 เราตัดสินใจที่จะนับแพ็คเก็ตน้อยเพื่อให้แน่ใจว่าแต่ละแพ็คเก็ตมี 100 ป้าย เมื่อเรานับฉลากเราพบว่าแพ็คเก็ตสั้น 100 ป้าย (เราพบ 97 ป้าย) เพื่อให้แน่ใจว่านี่ไม่ใช่โดยบังเอิญ แต่ได้ทำไปโดยเจตนาเราได้นับ 5 แพ็กเก็ตเพิ่มเติมและพบจำนวนป้ายกำกับต่อไปนี้ในแต่ละแพ็คเก็ต (รวมถึงแพ็กเก็ตแรก): Packet …

4
โควาเรียตที่ไม่มีนัยสำคัญทางสถิติควร 'เก็บไว้ใน' เมื่อสร้างแบบจำลองหรือไม่?
ฉันมีโควาเรียร์หลายตัวในการคำนวณแบบจำลองและไม่ใช่ทั้งหมดที่มีนัยสำคัญทางสถิติ ฉันควรลบสิ่งที่ไม่ใช่หรือไม่ คำถามนี้อธิบายถึงปรากฏการณ์ แต่ไม่ตอบคำถามของฉัน: จะตีความผลกระทบที่ไม่สำคัญของ covariate ใน ANCOVA อย่างไร ไม่มีอะไรในคำตอบสำหรับคำถามนั้นที่ชี้ให้เห็นว่ามีการแปรผันที่ไม่สำคัญออกไปแม้ว่าตอนนี้ฉันมีแนวโน้มที่จะเชื่อว่าพวกเขาควรจะอยู่ต่อไปก่อนที่จะอ่านคำตอบนั้น ยังสามารถอธิบายความแปรปรวนบางอย่าง (และช่วยให้แบบจำลอง) โดยไม่จำเป็นต้องอธิบายจำนวนเกินกว่าขีด จำกัด บางอย่าง (ค่าขีด จำกัด นัยสำคัญซึ่งฉันเห็นว่าไม่สามารถใช้ได้กับ covariates) มีอีกคำถามหนึ่งในประวัติย่อที่คำตอบดูเหมือนจะบ่งบอกว่า covariates ควรเก็บไว้โดยไม่คำนึงถึงความสำคัญ แต่ก็ไม่ชัดเจนในเรื่องนั้น (ฉันต้องการเชื่อมโยงกับคำถามนั้น แต่ฉันไม่สามารถติดตามได้อีกในตอนนี้) ดังนั้น ... โควาเรียต์ที่ไม่แสดงว่ามีนัยสำคัญทางสถิติควรถูกเก็บไว้ในการคำนวณสำหรับโมเดลหรือไม่? (ฉันได้แก้ไขคำถามนี้เพื่อชี้แจงว่า covariates ไม่เคยอยู่ในรูปแบบผลลัพธ์โดยการคำนวณอยู่ดี) หากต้องการเพิ่มความซับซ้อนจะเกิดอะไรขึ้นถ้าค่าความแปรปรวนร่วมมีความสำคัญทางสถิติสำหรับชุดย่อยบางส่วนของข้อมูล (ชุดย่อยที่ต้องดำเนินการแยกต่างหาก) ฉันจะเริ่มต้นที่จะรักษา covariate มิฉะนั้นจะต้องใช้โมเดลที่แตกต่างกันหรือคุณจะมี covariate ที่มีนัยสำคัญทางสถิติหายไปในกรณีใดกรณีหนึ่ง หากคุณมีคำตอบสำหรับคดีแยกนี้เช่นกันโปรดพูดถึงมัน

2
รูปแบบเอฟเฟกต์ผสมกับการทำรัง
ฉันมีข้อมูลที่รวบรวมจากการทดสอบที่จัดระเบียบดังนี้: สองไซต์แต่ละแห่งมีต้นไม้ 30 ต้น ได้รับการปฏิบัติ 15, 15 คือการควบคุมในแต่ละเว็บไซต์ จากต้นไม้แต่ละต้นเราสุ่มตัวอย่างก้านสามชิ้นและรากสามชิ้นดังนั้น 6 ระดับ 1 ตัวอย่างต่อต้นซึ่งแสดงโดยหนึ่งในสองระดับปัจจัย (รากลำต้น) จากนั้นตัวอย่างต้นกำเนิด / รากเราใช้สองตัวอย่างโดยการผ่าเนื้อเยื่อต่าง ๆ ภายในตัวอย่างซึ่งแสดงโดยหนึ่งในสองระดับปัจจัยสำหรับประเภทเนื้อเยื่อ (ประเภทเนื้อเยื่อ A, ประเภทเนื้อเยื่อ B) ตัวอย่างเหล่านี้วัดเป็นตัวแปรต่อเนื่อง จำนวนการสังเกตทั้งหมดคือ 720; 2 ไซต์ * ต้นไม้ 30 ต้น * (ตัวอย่างลำต้นสามชิ้น + ตัวอย่างรากสามต้น) * (เนื้อเยื่อหนึ่งตัวอย่าง + เนื้อเยื่อหนึ่งตัวอย่าง B) ข้อมูลมีลักษณะเช่นนี้ ... ï..Site Tree Treatment Organ Sample Tissue Total_Length …

6
ความประหยัดควรเป็นมาตรฐานทองคำหรือไม่
แค่ความคิด: แบบจำลองทางเลือกมักเป็นตัวเลือกเริ่มต้นในการเลือกรุ่น แต่วิธีนี้ล้าสมัยไปมากแค่ไหน? ฉันอยากรู้ว่าแนวโน้มของเราที่มีต่อช่วงเวลาที่เป็น parsimony นั้นเป็นเพียงช่วงเวลาหนึ่งของกฎ abaci และสไลด์ (หรือคอมพิวเตอร์ที่ไม่ทันสมัยอย่างจริงจังมากขึ้น) พลังการคำนวณของวันนี้ทำให้เราสามารถสร้างแบบจำลองที่ซับซ้อนมากขึ้นพร้อมความสามารถในการทำนายที่มากขึ้น จากผลของเพดานที่เพิ่มขึ้นในพลังการคำนวณนี้เรายังคงต้องหันเหความสนใจไปยังความเรียบง่ายหรือไม่ แน่นอนว่าโมเดลที่เรียบง่ายนั้นง่ายต่อการเข้าใจและตีความ แต่ในยุคของชุดข้อมูลที่มีจำนวนเพิ่มขึ้นเรื่อย ๆ พร้อมกับจำนวนตัวแปรที่มากขึ้นและการเปลี่ยนไปสู่การมุ่งเน้นที่ความสามารถในการทำนายมากขึ้น คิด?

2
ทำไมเราควรใช้ข้อผิดพลาด t แทนข้อผิดพลาดปกติ?
ในบล็อกโพสต์นี้โดย Andrew Gelman มีข้อความต่อไปนี้: แบบจำลองของ Bayesian เมื่อ 50 ปีที่แล้วดูเรียบง่ายอย่างสิ้นหวัง (ยกเว้นแน่นอนสำหรับปัญหาง่าย ๆ ) และฉันคาดหวังว่าแบบจำลองของ Bayesian ในวันนี้จะดูเรียบง่ายอย่างสิ้นหวัง 50 ปี (สำหรับตัวอย่างง่ายๆ: เราควรใช้ t แทนข้อผิดพลาดทั่วไปทุกที่ทุกเวลา แต่เรายังไม่ทำเช่นนี้เพราะความคุ้นเคยนิสัยและความสะดวกสบายทางคณิตศาสตร์สิ่งเหล่านี้อาจเป็นเหตุผลที่ดี ในการเมืองอนุรักษ์นิยมมีข้อโต้แย้งที่ดีหลายประการ - แต่ฉันคิดว่าท้ายที่สุดเมื่อเราคุ้นเคยกับแบบจำลองที่ซับซ้อนกว่านี้เราจะไปในทิศทางนั้น) ทำไมเราควร "ใช้ t เป็นประจำแทนที่จะเป็นข้อผิดพลาดทั่วไปทุกที่"

6
ในแง่ของคนธรรมดาอะไรคือความแตกต่างระหว่างแบบจำลองและการแจกแจง?
คำตอบ (คำจำกัดความ) ที่กำหนดไว้ใน Wikipedia นั้นค่อนข้างเป็นความลับเล็กน้อยสำหรับผู้ที่ไม่คุ้นเคยกับคณิตศาสตร์ / สถิติที่สูงขึ้น ในแง่คณิตศาสตร์แบบจำลองทางสถิติมักจะคิดว่าเป็นคู่ ( ) โดยที่คือชุดของการสังเกตที่เป็นไปได้เช่นพื้นที่ตัวอย่างและคือชุดของการแจกแจงความน่าจะเป็น ในSS,PS,PS, \mathcal{P}SSSPP\mathcal{P}SSS ในความน่าจะเป็นและสถิติการกระจายความน่าจะเป็นจะกำหนดความน่าจะเป็นให้แต่ละชุดย่อยที่วัดได้ของผลลัพธ์ที่เป็นไปได้ของการทดลองแบบสุ่มการสำรวจหรือขั้นตอนของการอนุมานทางสถิติ พบตัวอย่างที่มีพื้นที่ตัวอย่างไม่ใช่ตัวเลขซึ่งการแจกแจงจะเป็นการแจกแจงเชิงหมวดหมู่ ฉันเป็นนักเรียนมัธยมปลายที่สนใจงานด้านนี้มากเป็นงานอดิเรกและกำลังดิ้นรนกับความแตกต่างระหว่างสิ่งที่เป็นstatistical modelและprobability distribution ความเข้าใจที่เป็นอยู่ในปัจจุบันและพื้นฐานมากของฉันคือ: ตัวแบบเชิงสถิติคือความพยายามทางคณิตศาสตร์เพื่อประมาณการกระจายตัวที่วัด การแจกแจงความน่าจะเป็นคำอธิบายที่วัดได้จากการทดสอบที่กำหนดความน่าจะเป็นให้กับผลลัพธ์ที่เป็นไปได้ของเหตุการณ์สุ่ม ความสับสนจะเพิ่มขึ้นอีกโดยแนวโน้มในวรรณคดีเพื่อดูคำว่า "การกระจาย" และ "แบบจำลอง" ใช้แทนกันได้ - หรืออย่างน้อยในสถานการณ์ที่คล้ายกันมาก (เช่นการแจกแจงทวินามเทียบกับแบบจำลองทวินาม) ใครบางคนสามารถยืนยัน / แก้ไขคำจำกัดความของฉันและอาจเสนอวิธีการที่เป็นทางการมากขึ้น

5
โมเดลที่ติดตั้งเกินความจำเป็นไร้ประโยชน์หรือไม่?
สมมติว่าแบบจำลองมีความแม่นยำ 100% สำหรับข้อมูลการฝึกอบรม แต่ความแม่นยำ 70% สำหรับข้อมูลการทดสอบ อาร์กิวเมนต์ต่อไปนี้เป็นจริงเกี่ยวกับโมเดลนี้หรือไม่? เห็นได้ชัดว่านี่เป็นรุ่นที่ติดตั้งมากเกินไป ความแม่นยำในการทดสอบสามารถปรับปรุงได้โดยการลดการ overfitting แต่รุ่นนี้ยังคงเป็นรุ่นที่มีประโยชน์เนื่องจากมีความแม่นยำที่ยอมรับได้สำหรับข้อมูลการทดสอบ

3
อะไรคือความแตกต่างระหว่าง“ การทดสอบทางสถิติ” และ“ แบบจำลองเชิงสถิติ”?
ฉันกำลังติดตาม AW van der Vaart, สถิติแบบอะซิติกติก (1998) เขาพูดถึงการทดลองทางสถิติโดยอ้างว่าพวกเขาแตกต่างจากแบบจำลองทางสถิติ แต่เขาไม่ได้กำหนด คำถามของฉัน: (1) การทดลองทางสถิติคืออะไร (2) แบบจำลองทางสถิติและ (3) ส่วนประกอบสำคัญที่มักจะทำให้การทดลองทางสถิติแตกต่างจากแบบจำลองทางสถิติใด ๆ เสมอ?

3
ตัวแบบโมฆะในการถดถอยคืออะไรและเกี่ยวข้องกับสมมติฐานว่างอย่างไร
ตัวแบบโมฆะในการถดถอยคืออะไรและความสัมพันธ์ระหว่างตัวแบบโมฆะกับสมมติฐานว่างคืออะไร? เพื่อความเข้าใจของฉันมันหมายถึงอะไร ใช้ "ค่าเฉลี่ยของตัวแปรตอบสนอง" เพื่อทำนายตัวแปรตอบสนองต่อเนื่องหรือไม่ ใช้ "การกระจายฉลาก" ในการทำนายตัวแปรการตอบสนองแบบแยก? หากเป็นกรณีนี้ดูเหมือนว่าจะไม่มีการเชื่อมต่อระหว่างสมมติฐานว่าง

2
อะไรจะเป็นตัวอย่างของแบบจำลองที่เรียบง่ายและมีโอกาสเป็นไปไม่ได้?
ตัวอย่างการคำนวณแบบเบย์เป็นเทคนิคเจ๋งจริงๆสำหรับกระชับพื้นรูปแบบใดสุ่มไว้สำหรับรุ่นที่น่าจะเป็นว่ายาก (พูด, คุณสามารถลิ้มลองจากแบบจำลองถ้าคุณแก้ไขพารามิเตอร์ แต่คุณไม่สามารถตัวเลขอัลกอริทึมหรือการวิเคราะห์คำนวณความเป็นไปได้) เมื่อแนะนำการคำนวณแบบเบย์โดยประมาณ (ABC) ให้กับผู้ชมเป็นเรื่องดีที่จะใช้แบบจำลองตัวอย่างที่เรียบง่าย แต่ก็ยังน่าสนใจอยู่บ้างและมีความเป็นไปได้ยาก อะไรจะเป็นตัวอย่างที่ดีของแบบจำลองง่ายๆที่ยังมีโอกาสที่ดื้อดึง?

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

3
ตัวเลือกในรูปแบบการถดถอยความเป็นอันตรายแบบสัดส่วนเมื่อส่วนที่เหลือของ Schoenfeld ไม่ดีมีอะไรบ้าง
ฉันกำลังทำการถดถอยแบบอันตรายตามสัดส่วนของ Cox ในการใช้ R coxphซึ่งรวมถึงตัวแปรจำนวนมาก ส่วนที่เหลือ Martingale ดูดีและส่วนที่เหลือ Schoenfeld นั้นยอดเยี่ยมสำหรับเกือบทุกตัวแปร มีสามตัวแปรที่มี Schoenfeld ส่วนที่เหลือไม่แบนและลักษณะของตัวแปรนั้นมันทำให้รู้สึกว่าพวกเขาอาจแตกต่างกันไปตามเวลา นี่คือตัวแปรที่ฉันไม่สนใจจริง ๆ ดังนั้นการทำให้เป็นชั้นจะดี อย่างไรก็ตามพวกเขาทั้งหมดเป็นตัวแปรต่อเนื่องไม่ใช่ตัวแปรเด็ดขาด ดังนั้นฉันจึงเข้าใจชั้นที่จะไม่เป็นเส้นทาง * ฉันได้ลองสร้างปฏิสัมพันธ์ระหว่างตัวแปรและเวลาตามที่อธิบายไว้ที่นี่แต่เราได้รับข้อผิดพลาด: In fitter(X, Y, strats, offset, init, control, weights = weights, : Ran out of iterations and did not converge ฉันทำงานกับจุดข้อมูลเกือบ 1,000 จุดและทำงานกับตัวแปรครึ่งโหลด้วยหลาย ๆ ปัจจัยแต่ละตัวดังนั้นจึงรู้สึกเหมือนว่าเรากำลังผลักดันขีด จำกัด ของวิธีที่ข้อมูลนี้จะถูกหั่นและหั่นเป็นลูกเต๋า โชคไม่ดีโมเดลที่เรียบง่ายทั้งหมดที่ฉันได้ลองด้วยตัวแปรที่รวมอยู่น้อยกว่านั้นแย่ลงอย่างชัดเจน ตัวเลือกของฉันคืออะไร? เนื่องจากฉันไม่สนใจเกี่ยวกับตัวแปรที่มีพฤติกรรมแย่ ๆ …

2
เมื่อพิจารณาจากโมเดลการถดถอยเชิงเส้นสองแบบ
ฉันเรียนหลักสูตรการเรียนรู้ด้วยเครื่องที่วิทยาลัยของฉัน หนึ่งในคำถามหนึ่งคำถามนี้ถูกถาม รุ่น 1: y=θx+ϵy=θx+ϵ y = \theta x + \epsilon รุ่น 2: y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon รุ่นใดที่เหมาะกับข้อมูลที่ดีกว่า (สมมติว่าข้อมูลสามารถสร้างแบบจำลองโดยใช้การถดถอยเชิงเส้น) คำตอบที่ถูกต้อง (ตามอาจารย์) ก็คือทั้งสองรุ่นจะทำงานได้ดีเท่ากัน อย่างไรก็ตามฉันเชื่อว่ารุ่นแรกจะเหมาะกว่า นี่คือเหตุผลที่อยู่เบื้องหลังคำตอบของฉัน รุ่นที่สองซึ่งสามารถเขียนใหม่เป็น , α = θ + θ 2จะไม่เหมือนกับรุ่นแรก อันที่จริงแล้วαเป็นพาราโบลาและดังนั้นจึงมีค่าต่ำสุด ( - 0.25ในกรณีนี้) ด้วยเหตุนี้ช่วงของθในรุ่นแรกจึงมากกว่าช่วงของαในรุ่นที่สอง ดังนั้นหากข้อมูลเป็นเช่นนั้นแบบที่ดีที่สุดมีความชันน้อยกว่า- 0.25โมเดลที่สองจะทำงานได้ไม่ดีมากเมื่อเทียบกับรุ่นแรก อย่างไรก็ตามในกรณีที่ความลาดเอียงของแบบที่ดีที่สุดมากกว่าαx+ϵαx+ϵ \alpha x + \epsilon …

2
การอนุมานเชิงสถิติภายใต้การสะกดผิด
การรักษาแบบดั้งเดิมของการอนุมานทางสถิติอาศัยสมมติฐานที่ว่ามีการใช้สถิติที่ระบุอย่างถูกต้อง นั่นคือการกระจายP∗(Y)P∗(Y)\mathbb{P}^*(Y)ที่สร้างข้อมูลที่สังเกตได้เป็นส่วนหนึ่งของแบบจำลองทางสถิติ : อย่างไรก็ตามในสถานการณ์ส่วนใหญ่เราไม่สามารถสรุปได้ว่านี่เป็นเรื่องจริง ฉันสงสัยว่าจะเกิดอะไรขึ้นกับขั้นตอนการอนุมานเชิงสถิติหากเราทิ้งสมมติฐานที่ระบุไว้อย่างถูกต้องyyyMM\mathcal{M}P∗(Y)∈M={Pθ(Y):θ∈Θ}P∗(Y)∈M={Pθ(Y):θ∈Θ}\mathbb{P}^*(Y) \in \mathcal{M}=\{\mathbb{P}_\theta(Y) :\theta \in \Theta\} ฉันได้พบงานบางอย่างของWhite 1982ในการประมาณ ML ภายใต้การสะกดผิด มันเป็นที่ถกเถียงกันอยู่ว่ามีความเป็นไปได้มากที่สุดคือการประเมินที่สอดคล้องกันสำหรับการแจกแจง ที่ช่วยลด KL-แตกต่างจากการกระจายทั้งหมดภายในแบบจำลองทางสถิติและการจัดจำหน่ายจริง\ mathbb {P} ^ *Pθ1=argminPθ∈MKL(P∗,Pθ)Pθ1=arg⁡minPθ∈MKL(P∗,Pθ)\mathbb{P}_{\theta_1}=\arg \min_{\mathbb{P}_\theta \in \mathcal{M}} KL(\mathbb{P}^*,\mathbb{P}_\theta)P∗P∗\mathbb{P}^* เกิดอะไรขึ้นกับตัวประมาณค่าความเชื่อมั่น ให้สรุปความเชื่อมั่นชุดประเมิน Let δ:ΩY→2Θδ:ΩY→2Θ\delta:\Omega_Y \rightarrow 2^\Thetaเป็นประมาณการที่ตั้งไว้ที่ΩYΩY\Omega_Yเป็นพื้นที่ตัวอย่างและ2Θ2Θ2^\Thetaชุดไฟมากกว่าพื้นที่พารามิเตอร์\ΘΘ\Thetaสิ่งที่เราอยากรู้คือความน่าจะเป็นของเหตุการณ์ที่ชุดที่สร้างโดยδδ\deltaรวมการแจกแจงที่แท้จริงP∗P∗\mathbb{P}^*นั่นคือP∗(P∗∈{Pθ:θ∈δ(Y)}):=A.P∗(P∗∈{Pθ:θ∈δ(Y)}):=A.\mathbb{P}^*(\mathbb{P}^* \in \{P_\theta : \theta \in \delta(Y)\}):=A. อย่างไรก็ตามเราแน่นอนไม่ทราบความจริงการกระจาย * สมมติฐานที่กำหนดไว้อย่างถูกต้องบอกเราว่า{M} อย่างไรก็ตามเรายังไม่ทราบว่าเป็นรุ่นใด แต่เป็นผูกพันที่ต่ำกว่าสำหรับความน่าจะเป็น Equationคือการ จำกัด คลาสสิกของระดับความเชื่อมั่นสำหรับตัวประมาณค่าชุดความเชื่อมั่นP∗P∗\mathbb{P}^*P∗∈MP∗∈M\mathbb{P}^* \in \mathcal{M}infθ∈ΘPθ(θ∈δ(Y)):=Binfθ∈ΘPθ(θ∈δ(Y)):=B\inf_{\theta \in \Theta} \mathbb{P}_\theta(\theta …

1
การตีความเอาต์พุตการถดถอยจากโมเดลผสมเมื่อการโต้ตอบระหว่างตัวแปรเด็ดขาดถูกรวมไว้
ฉันมีคำถามเกี่ยวกับการใช้โมเดลผสม / Lmer ของฉัน โมเดลพื้นฐานคือ: lmer(DV ~ group * condition + (1|pptid), data= df) กลุ่มและเงื่อนไขเป็นทั้งสองปัจจัย: กลุ่มมีสองระดับ (groupA, groupB) และเงื่อนไขมีสามระดับ (เงื่อนไข 1, เงื่อนไข 2, เงื่อนไข 3) มันเป็นข้อมูลจากวิชามนุษย์ดังนั้น pptid จึงเป็นผลแบบสุ่มสำหรับแต่ละคน โมเดลพบสิ่งต่อไปนี้พร้อมกับเอาต์พุตค่า p: Estimate MCMCmean HPD95lower HPD95upper pMCMC Pr(>|t|) (Intercept) 6.1372 6.1367 6.0418 6.2299 0.0005 0.0000 groupB -0.0614 -0.0602 -0.1941 0.0706 0.3820 0.3880 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.