คำถามติดแท็ก proportion

สัดส่วนคือเศษส่วนของผลรวมบางส่วนที่มีลักษณะเฉพาะเช่น (i) เป็นจำนวนสิ่งหนึ่งประเภทจากจำนวนทั้งหมดหรือ (ii) เป็นส่วนประกอบของตัวแปรต่อเนื่อง

1
การติดตั้ง GLOM แบบทวินาม (glmer) กับตัวแปรตอบกลับที่เป็นสัดส่วนหรือเศษส่วน
ฉันหวังว่าใครบางคนสามารถช่วยในสิ่งที่ฉันคิดว่าเป็นคำถามที่ค่อนข้างง่ายและฉันคิดว่าฉันรู้คำตอบ แต่ไม่มีการยืนยันมันกลายเป็นสิ่งที่ฉันไม่แน่ใจ ฉันมีข้อมูลการนับเป็นตัวแปรตอบกลับและฉันต้องการวัดว่าตัวแปรนั้นเปลี่ยนแปลงไปอย่างไรด้วยการมีสัดส่วนของบางสิ่งบางอย่าง ในรายละเอียดเพิ่มเติมตัวแปรตอบสนองจะนับการมีอยู่ของสปีชีส์ของแมลงในหลาย ๆ ไซต์ดังนั้นตัวอย่างจะถูกสุ่มตัวอย่าง 10 ครั้งและสปีชีส์นี้อาจเกิดขึ้น 4 ครั้ง ฉันต้องการที่จะดูว่าสิ่งนี้มีความสัมพันธ์กับการปรากฏตัวตามสัดส่วนของกลุ่มพันธุ์พืชใน commmunity โดยรวมของพืชที่เว็บไซต์เหล่านี้ ซึ่งหมายความว่าข้อมูลของฉันมีลักษณะดังนี้ (นี่เป็นเพียงตัวอย่าง) Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence 1, 5, 10, 0.5 2, 3, 10, 0.3 3, 7, 9, 0.6 4, 0, 9, 0.1 ข้อมูลยังรวมถึงเอฟเฟกต์แบบสุ่มสำหรับตำแหน่ง ฉันคิดว่าสองวิธีหนึ่งจะเป็นแบบจำลองเชิงเส้น ( lmer) กับแมลงที่แปลงเป็นสัดส่วนเช่น lmer.model<-lmer(insectCount/NumberOfInsectSamples~ ProportionalPlantGroupPresence+(1|Location),data=Data) ครั้งที่สองจะเป็นแบบทวินาม GLMM ( glmer) เช่น glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~ …

4
แผนภาพนี้เรียกว่าอะไร
ใครสามารถบอกฉันว่าชื่อของแผนภาพประเภทนี้ (ถ้ามี) คืออะไร? ทุกคนสามารถแนะนำเครื่องมือใด ๆ แต่ง่าย ๆ ในการพล็อตแผนภาพดังกล่าวได้หรือไม่?

1
ทำไมสัดส่วนตัวอย่างถึงไม่มีการกระจายแบบทวินาม
ในการตั้งค่าทวินามตัวแปรสุ่ม X ที่ให้จำนวนความสำเร็จนั้นมีการแจกแจงแบบทวินาม สัดส่วนตัวอย่างสามารถคำนวณได้เป็นโดยที่คือขนาดตัวอย่างของคุณ ตำราของฉันระบุว่าXnXn\frac{X}{n}nnn สัดส่วนนี้ไม่ได้มีการกระจายทวินาม แต่ตั้งแต่เป็นเพียงรุ่นปรับขนาดของการกระจาย binomially ตัวแปรสุ่มไม่ควรก็ยังมีการกระจายทวินาม?XnXn\frac{X}{n}XXX

4
ทำไมจึงไม่เป็นไรที่จะทำการสหสัมพันธ์แบบเพียร์สันกับข้อมูลสัดส่วน
โมดูลออนไลน์ที่ฉันกำลังศึกษาระบุว่าไม่ควรใช้เพียร์สันสหสัมพันธ์กับข้อมูลสัดส่วน ทำไมจะไม่ล่ะ? หรือถ้าบางครั้งมันก็โอเคหรือเสมอโอเคทำไม?

1
การกำหนดขนาดตัวอย่างด้วยสัดส่วนและการแจกแจงทวินาม
ฉันกำลังพยายามเรียนรู้สถิติบางอย่างโดยใช้หนังสือ Biometry โดย Sokal และ Rohlf (3e) นี่คือแบบฝึกหัดในบทที่ 5 ซึ่งครอบคลุมความน่าจะเป็นการแจกแจงทวินามและการแจกแจงปัวซอง ฉันรู้ว่ามีสูตรสำหรับสร้างคำตอบสำหรับคำถามนี้: อย่างไรก็ตามสมการนี้ไม่ได้อยู่ในข้อความนี้ ฉันต้องการทราบวิธีการคำนวณขนาดตัวอย่างที่ทราบเฉพาะความน่าจะเป็นระดับความเชื่อมั่นที่ต้องการและการกระจายแบบทวินาม มีทรัพยากรใดบ้างที่ครอบคลุมหัวข้อนี้ที่ฉันสามารถชี้ได้ ฉันลองใช้ Google แล้ว แต่สิ่งที่ฉันเห็นมาแล้วต้องการข้อมูลที่ฉันไม่สามารถเข้าถึงได้ในปัญหานี้n = 4( หน้า-√- คิว√)2n=4(p−q)2 n = \frac 4 {( \sqrt{p} - \sqrt{q} )^2}

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
ทดสอบสัดส่วนและตัวจําแนกไบนารี
ฉันมีเครื่องผลิตชิ้นส่วนต้นแบบ ในการทดสอบครั้งแรกเครื่องผลิตชิ้นส่วนและลักษณนามไบนารีบอกฉันว่าd 1ส่วนมีข้อบกพร่อง ( d 1 &lt; N 1มักจะวันที่1 / N 1 &lt; 0.01และN 1 ≈ 10 4 ) และN 1 - d 1ชิ้นส่วนเป็นสิ่งที่ดียังไม่มีข้อความ1N1N_1d1d1d_1d1&lt; N1d1&lt;N1d_1 < N_1d1/ N1&lt; 0.01d1/N1&lt;0.01d_1/N_1<0.01ยังไม่มีข้อความ1≈ 104N1≈104N_1\approx10^4ยังไม่มีข้อความ1- d1N1−d1N_1-d_1 จากนั้นช่างเทคนิคจะทำการเปลี่ยนแปลงบางอย่างในเครื่องเพื่อลดจำนวนชิ้นส่วนที่บกพร่อง ในการทดสอบที่สองและต่อไปนี้การปรับเปลี่ยนเครื่องผลิตชิ้นส่วนและลักษณนามไบนารีเดียวกัน (แตะต้อง) บอกผมว่าd 2ส่วนมีข้อบกพร่องอยู่แล้ววันที่2 / N 2ค่อนข้างคล้ายกับd 1 / N 1ยังไม่มีข้อความ2N2N_2d2d2d_2d2/ N2d2/N2d_2/N_2d1/ N1d1/N1d_1/N_1 ช่างต้องการทราบว่าการเปลี่ยนแปลงของเขามีประสิทธิภาพหรือไม่ สมมติว่าตัวแยกประเภทสมบูรณ์แบบ (ความไวของมันคือ 100% และความเฉพาะเจาะจงของมันคือ …

3
เหตุใดข้อผิดพลาดมาตรฐานของสัดส่วนสำหรับ n ที่กำหนดซึ่งใหญ่ที่สุดสำหรับ 0.5
ความคลาดเคลื่อนมาตรฐานของสัดส่วนจะมากที่สุดเท่าที่จะเป็นไปได้สำหรับ N ที่กำหนดเมื่อสัดส่วนของปัญหาเท่ากับ 0.5 และยิ่งเล็กลงยิ่งอัตราส่วนต่อจาก 0.5 ฉันเห็นได้ว่าเหตุใดจึงเป็นเช่นนี้เมื่อฉันดูสมการสำหรับความคลาดเคลื่อนมาตรฐานของสัดส่วน แต่ฉันไม่สามารถอธิบายสิ่งนี้ได้อีก มีคำอธิบายนอกเหนือจากคุณสมบัติทางคณิตศาสตร์ของสูตรหรือไม่? ถ้าเป็นเช่นนั้นเหตุใดจึงมีความไม่แน่นอนน้อยลงในสัดส่วนที่ประมาณไว้ (สำหรับ N ที่ระบุ) เมื่อใกล้ถึง 0 หรือ 1

1
ขนาดตัวอย่างสำหรับสัดส่วนในการวัดซ้ำ
ฉันพยายามช่วยนักวิทยาศาสตร์ในการออกแบบการศึกษาสำหรับการเกิดขึ้นของเชื้อจุลินทรีย์เชื้อ Salmonella เขาต้องการเปรียบเทียบสูตรยาต้านจุลชีพที่ทดลองกับคลอรีน (สารฟอกขาว) ที่ฟาร์มสัตว์ปีก เนื่องจากอัตราพื้นหลังของเชื้อซัลโมเนลล่าแตกต่างกันไปตามกาลเวลาเขาจึงวางแผนที่จะวัด% สัตว์ปีกด้วยซัลโมเนลลาก่อนการรักษาและหลังการรักษา ดังนั้นการวัดจะเป็นความแตกต่างของ% salmonella ก่อน / หลังสำหรับสูตรการทดลองกับคลอรีน ใครสามารถให้คำแนะนำเกี่ยวกับวิธีการประเมินขนาดตัวอย่างที่จำเป็น? สมมุติว่าอัตราพื้นหลัง 50%; หลังจากฟอกสีเป็น 20%; และเราต้องการตรวจสอบว่าสูตรการทดลองเปลี่ยนอัตรา +/- 10% หรือไม่ ขอบคุณ แก้ไข: สิ่งที่ฉันกำลังดิ้นรนกับวิธีการรวมอัตราพื้นหลัง ลองเรียกพวกเขาว่า p3 และ p4 ซึ่งเป็นอัตรา "ก่อนหน้า" สำหรับเชื้อฟอกขาวและตัวอย่างทดลองตามลำดับ ดังนั้นสถิติที่จะประมาณคือความแตกต่างของความแตกต่าง: การทดลอง (หลัง - ก่อน) - Bleach (หลัง - ก่อน) = (p0-p2) - (p3-p1) หากต้องการพิจารณารูปแบบการสุ่มตัวอย่างทั้งหมดของ "ก่อน" อัตรา p2 และ …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.