คำถามติดแท็ก interpretation

อ้างถึงข้อสรุปที่สำคัญจากผลการวิเคราะห์ทางสถิติ

1
การตีความสัดส่วนที่รวมหนึ่งเป็นตัวแปรอิสระในการถดถอยเชิงเส้น
ฉันคุ้นเคยกับแนวคิดของตัวแปรเด็ดขาดและการเข้ารหัสตัวแปรดัมมี่ตามลำดับที่ช่วยให้เราสามารถปรับให้เป็นหนึ่งในระดับพื้นฐานเพื่อหลีกเลี่ยงความไม่ลงรอยกัน ฉันยังคุ้นเคยกับวิธีตีความการประมาณค่าพารามิเตอร์จากโมเดลดังกล่าว: การเปลี่ยนแปลงที่คาดการณ์ไว้ในผลลัพธ์สำหรับระดับที่เหมาะสมของเครื่องทำนายหมวดหมู่สัมพันธ์กับหมวดหมู่พื้นฐาน สิ่งที่ฉันไม่แน่ใจเกี่ยวกับวิธีการตีความชุดของตัวแปรอิสระที่มีสัดส่วนที่ว่าผลรวมให้เป็นหนึ่ง เรามี collinearity อีกครั้งถ้าเราพอดีทุกสัดส่วนในโมเดลดังนั้นสมมุติว่าเราจะต้องปล่อยให้หมวดหมู่หนึ่งเป็นพื้นฐาน ฉันยังคิดว่าฉันจะดูประเภท III SS สำหรับการทดสอบโดยรวมของความสำคัญของตัวแปรนี้ อย่างไรก็ตามเราจะตีความพารามิเตอร์ประมาณการสำหรับระดับที่เหมาะสมในแบบจำลองเทียบกับที่ถือว่าเป็นพื้นฐานได้อย่างไร ตัวอย่าง : ที่ระดับรหัสไปรษณีย์ตัวแปรอิสระคือสัดส่วนของหินแปรหินอัคนีและหินตะกอน อย่างที่คุณอาจทราบว่าหินทั้งสามชนิดนี้สำคัญและหินทั้งหมดจัดอยู่ในประเภทใดประเภทหนึ่ง ดังนั้นสัดส่วนในผลรวมทั้งสามต่อ 1 ผลที่ได้คือระดับเรดอนเฉลี่ยในรหัสไปรษณีย์ที่เกี่ยวข้อง ถ้าฉันจะพอดีพูดสัดส่วนแปรสภาพและการเผาไหม้เป็นแบบทำนายในแบบจำลองปล่อยให้ตะกอนเป็นพื้นฐานประเภทโดยรวม III SS F - การทดสอบของทั้งสองระดับติดตั้งจะมีความหมายว่าประเภทหินโดยรวมเป็นสิ่งสำคัญ ตัวทำนายผล (ระดับเรดอนโดยเฉลี่ย) จากนั้นฉันสามารถดูค่าp-valueแต่ละตัว(ตามการแจกแจงt ) เพื่อพิจารณาว่าหินชนิดใดชนิดหนึ่งหรือทั้งสองนั้นแตกต่างจากฐานอย่างมีนัยสำคัญ อย่างไรก็ตามเมื่อมันมาถึงการประมาณค่าพารามิเตอร์สมองของฉันต้องการที่จะตีความพวกเขาอย่างหมดจดเป็นการเปลี่ยนแปลงที่คาดการณ์ไว้ในผลระหว่างกลุ่ม (ประเภทหิน) และฉันไม่เข้าใจวิธีการรวมความจริงที่ว่าพวกเขาพอดีเป็นสัดส่วน . หากการประมาณค่าสำหรับการแปรเปลี่ยนเป็นเช่น 0.43 การตีความนั้นไม่ใช่เพียงแค่ระดับเรดอนเฉลี่ยที่คาดการณ์เพิ่มขึ้น 0.43 หน่วยเมื่อหินนั้นแปรสภาพกับตะกอน อย่างไรก็ตามการตีความยังไม่เพียง แต่สำหรับการเพิ่มขึ้นของหน่วยบางประเภท (พูด 0.1) ในสัดส่วนของประเภทหินแปรเนื่องจากมันไม่ได้สะท้อนความจริงที่ว่ามันยังสัมพันธ์กับพื้นฐาน ( ตะกอน ) และนอกจากนี้การเปลี่ยนแปลงนั้น สัดส่วนของการเปลี่ยนแปลงโดยเนื้อแท้การเปลี่ยนแปลงสัดส่วนของพอดีระดับหินอื่น ๆ …

1
ความหมายของแกน y ในพล็อตฟอเรสต์แบบสุ่มบางส่วนของ Forest
ฉันใช้RandomForestแพคเกจ R และสับสนในการตีความค่าของแกน Y ในแผนการพึ่งพาบางส่วนของพวกเขา ช่วยให้เอกสารระบุว่าพล็อตนั้นเป็น "การแสดงภาพกราฟิกของเอฟเฟกต์เล็กน้อยของตัวแปรในความน่าจะเป็นของชั้นเรียน" อย่างไรก็ตามฉันยังสับสนว่าแกน y หมายถึงอะไร โดยเฉพาะอย่างยิ่งค่าลบหมายถึงอะไร การมีอิทธิพลในทางลบต่อการทำนายชั้นเรียนอย่างถูกต้องหมายความว่าอย่างไร และอะไรคือคุณสมบัติที่สำคัญที่สุดจากตัวเลขเหล่านี้มันคือค่าสูงสุดรูปร่างของเทรนด์ ฯลฯ หรือไม่ คุณสามารถเปรียบเทียบแปลงบางส่วนกับแปลงบางส่วนของตัวแปรอื่น ๆ ได้หรือไม่? แปลงเหล่านี้อาจเปรียบเทียบกับเส้นโค้งการตอบสนองที่สร้างใน Maxent (ซอฟต์แวร์การสร้างแบบจำลองการกระจาย) ได้อย่างไร

1
วิธีตีความพล็อตความสัมพันธ์อัตโนมัติใน MCMC
ฉันคุ้นเคยกับสถิติแบบเบย์โดยการอ่านหนังสือDoing Bayesian Data Analysisโดย John K. Kruschke หรือที่เรียกว่า "puppy book" ในบทที่ 9 มีการแนะนำตัวแบบลำดับชั้นด้วยตัวอย่างง่าย ๆ นี้: และการสังเกตของเบอร์นูลีคือ 3 เหรียญต่อการโยน 10 ครั้ง หนึ่งแสดง 9 หัวอื่น ๆ 5 หัวและอีก 1 หัวyjiθjμκ∼Bernoulli(θj)∼Beta(μκ,(1−μ)κ)∼Beta(Aμ,Bμ)∼Gamma(Sκ,Rκ)yji∼Bernoulli(θj)θj∼Beta(μκ,(1−μ)κ)μ∼Beta(Aμ,Bμ)κ∼Gamma(Sκ,Rκ)\begin{align} y_{ji} &\sim {\rm Bernoulli}(\theta_j) \\ \theta_j &\sim {\rm Beta}(\mu\kappa, (1-\mu)\kappa) \\ \mu &\sim {\rm Beta}(A_\mu, B_\mu) \\ \kappa &\sim {\rm Gamma}(S_\kappa, R_\kappa) …

3
ฉันจะตีความพล็อตเปอร์เซ็นต์การตัดแต่งเทียบกับค่าเฉลี่ยที่ถูกตัดได้อย่างไร
สำหรับคำถามการบ้านฉันถูกขอให้คำนวณค่าเฉลี่ยที่ถูกตัดสำหรับชุดข้อมูลโดยการลบการสังเกตที่เล็กที่สุดและใหญ่ที่สุดและตีความผลลัพธ์ ค่าเฉลี่ยที่ถูกตัดนั้นต่ำกว่าค่าเฉลี่ยที่ไม่ได้รับการตัดต่อ การตีความของฉันคือว่านี่เป็นเพราะการแจกแจงพื้นฐานนั้นเบ้ในทางบวกดังนั้นหางซ้ายจึงทึบกว่าหางขวา ผลที่ตามมาจากความเบ้นี้การลบตัวเลขที่สูงจะลากค่าเฉลี่ยลงมากกว่าการลบค่าต่ำที่ผลักมันขึ้นเพราะการพูดอย่างไม่เป็นทางการมีข้อมูลต่ำมาก "รอให้เกิดขึ้น" (มันสมเหตุสมผลหรือไม่) จากนั้นฉันก็เริ่มสงสัยว่าเปอร์เซ็นต์การตัดแต่งมีผลต่อสิ่งนี้อย่างไรดังนั้นฉันคำนวณค่าเฉลี่ยที่ถูกตัดสำหรับต่าง ๆ n ฉันมีรูปโค้งที่น่าสนใจ: x¯tr(k)x¯tr⁡(k)\bar x_{\operatorname{tr}(k)}k=1/n,2/n,…,(n2−1)/nk=1/n,2/n,…,(n2−1)/nk = 1/n, 2/n, \dotsc, (\frac{n}{2}-1)/n ฉันค่อนข้างไม่แน่ใจว่าจะตีความสิ่งนี้อย่างไร โดยสังหรณ์ใจดูเหมือนว่าความชันของกราฟควรเป็น (สัดส่วน) ความเบ้ลบของส่วนการกระจายภายในจุดข้อมูลของค่ามัธยฐาน (สมมติฐานนี้ตรวจสอบกับข้อมูลของฉัน แต่ฉันมีเพียงดังนั้นฉันไม่มั่นใจมาก)kkkn=11n=11n = 11 กราฟประเภทนี้มีชื่อหรือใช้กันทั่วไปหรือไม่ เราสามารถรวบรวมข้อมูลอะไรจากกราฟนี้ มีการตีความมาตรฐานหรือไม่? สำหรับการอ้างอิงข้อมูลคือ: 4, 5, 5, 6, 11, 17, 18, 23, 33, 35, 80

2
การตีความเมทริกซ์ความแปรปรวนร่วม -
สมมติว่าเรามีโมเดลเชิงเส้นModel1และvcov(Model1)ให้เมทริกซ์ต่อไปนี้: (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550 altitude 0.507906 -0.4247145 -0.6261255 0.00928242 สำหรับตัวอย่างนี้เมทริกซ์นี้แสดงอะไร? สมมติฐานอะไรที่เราสามารถสร้างโมเดลของเราได้อย่างปลอดภัยและเป็นตัวแปรอิสระ

2
สถิติพิซซ่าสำหรับฝูง
ข้อมูลสั้น ๆ เกี่ยวกับเว็บไซต์ NY Times นำเสนอข้อเท็จจริงและตัวเลขการบริโภคพิซซ่าในสหรัฐอเมริกา ฉันมีความสนใจในการใช้สถิติ (หรือถูกทารุณกรรม) เพื่อให้ข้อมูลแก่ผู้ชมทั่วไปและคำถามสองสามข้อได้เกิดขึ้นตามสถิติที่นำเสนอ: ถ้าคนอเมริกัน 1 ใน 8 คนจะกินพิซซ่าในวันนี้นั่นหมายความว่าคนอเมริกันโดยเฉลี่ยจะกินพิซซ่าทุกๆ 8 วันหรือไม่? มีสมมติฐานว่าที่นี่ทุกคนอเมริกันกินพิซซ่าซึ่งไม่ใช่กรณี; อย่างไรก็ตามนั่นทำให้เกิดคำถามว่าจะทำให้สมมติฐานที่ถูกต้องของจำนวนชาวอเมริกันที่กินพิซซ่า มีรายงานว่า 25% ของการบริโภคแคลอรี่ของเด็กคือพิซซ่า ฉันจะให้คำจำกัดความของเด็กอายุ 9 ขวบที่มีความกระตือรือร้นปานกลางดังนั้นจึงจำเป็นต้องได้รับแคลอรี่ 2,000 ครั้งต่อวัน หากเราเชื่อมั่นในการประมาณการของ Google ว่าจำนวนแคลอรี่ในชิ้นพิซซ่าเท่ากับ 285 แสดงว่าแนะนำให้เด็กกินพิซซ่า 12 ชิ้นต่อสัปดาห์โดยเฉลี่ยหรือไม่ (2000 * 7 * 0.25 / 285) ฉันสงสัยว่าการตีความสถิติของฉันมีข้อบกพร่อง ฉันไม่เห็นด้วยหรอกว่าเด็ก ๆ อาจเป็นส่วนหนึ่งของชาวอเมริกัน 1 ใน 8 คนที่กินพิซซ่าวันนี้ในขณะที่กินวันละ 1.7 ชิ้นต่อวันเพื่อให้ได้ปริมาณแคลอรี่ …

3
เหตุผลที่เข้าใจได้ง่ายว่าเหตุใดข้อมูลฟิชเชอร์ของ Binomial จึงแปรผกผันกับ
มันสับสน / พัดใจของฉันที่มีความแปรปรวนทวินามสัดส่วนกับP) เท่าข้อมูลฟิชเชอร์เป็นสัดส่วนกับ(1-P)} อะไรคือสาเหตุของสิ่งนี้? ทำไมข้อมูลฟิชเชอร์ที่ลดลง ? นั่นคือเหตุผลว่าทำไมการอนุมานที่ยากที่สุดที่ ?1p(1−p)p(1−p)p(1-p) p=0.5p=0.51p(1−p)1p(1−p)\frac{1}{p(1-p)}p=0.5p=0.5p=0.5p=0.5p=0.5p=0.5 บริบท: ฉันกำลังทำงานกับเครื่องคิดเลขขนาดตัวอย่างและสูตรสำหรับขนาดตัวอย่างที่ต้องการเป็นปัจจัยที่เพิ่มขึ้นของซึ่งเป็นผลมาจากการประมาณค่าความแปรปรวนในการหาค่าp ( 1 - p )NNNp(1−p)p(1−p)p(1-p)

1
ฉันสามารถตีความการรวมคำศัพท์กำลังสองในการถดถอยโลจิสติกส์เพื่อระบุจุดเปลี่ยนได้หรือไม่?
ในการถดถอยโลจิสติกับการเชิงเส้นและสมการกำลังสองแง่เท่านั้นถ้าฉันมีค่าสัมประสิทธิ์เชิงเส้นβ1β1\beta_1และสมการกำลังสองค่าสัมประสิทธิ์β2β2\beta_2ผมสามารถพูดได้ว่ามีจุดของความน่าจะเปลี่ยนที่−β1/(2β2)−β1/(2β2)-\beta_1 / (2\beta_2) ?

1
การตีความค่าสัมประสิทธิ์การถดถอย LASSO
ขณะนี้ฉันกำลังทำงานเพื่อสร้างแบบจำลองการทำนายผลเลขฐานสองบนชุดข้อมูลที่มีตัวแปร ~ 300 และ 800 ข้อสังเกต ฉันได้อ่านมากเกี่ยวกับปัญหาที่เกี่ยวข้องกับการถดถอยแบบขั้นตอนและทำไมไม่ใช้มัน ฉันอ่านเกี่ยวกับการถดถอยของ LASSO และความสามารถในการเลือกคุณสมบัติและประสบความสำเร็จในการนำไปใช้งานด้วยการใช้แพ็คเกจ "caret" และ "glmnet" ฉันสามารถดึงค่าสัมประสิทธิ์ของแบบจำลองด้วยค่าที่ดีที่สุดlambdaและalphaจาก "caret"; อย่างไรก็ตามฉันไม่คุ้นเคยกับวิธีตีความค่าสัมประสิทธิ์ สัมประสิทธิ์ LASSO ตีความในวิธีเดียวกันกับการถดถอยโลจิสติกหรือไม่? มันจะเหมาะสมที่จะใช้คุณสมบัติที่เลือกจาก LASSO ในการถดถอยโลจิสติก? แก้ไข การตีความของค่าสัมประสิทธิ์เช่นเดียวกับค่าสัมประสิทธิ์แทนจากการถดถอย LASSO เป็นอัตราต่อรองสำหรับการเปลี่ยนแปลง 1 หน่วยในสัมประสิทธิ์ในขณะที่ค่าคงที่สัมประสิทธิ์อื่น ๆ ทั้งหมด https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-how-do-i-interpret-odds-ratios-in-logistic-regression/

2
การตีความพล็อต QQ
พิจารณารหัสและผลลัพธ์ต่อไปนี้: par(mfrow=c(3,2)) # generate random data from weibull distribution x = rweibull(20, 8, 2) # Quantile-Quantile Plot for different distributions qqPlot(x, "log-normal") qqPlot(x, "normal") qqPlot(x, "exponential", DB = TRUE) qqPlot(x, "cauchy") qqPlot(x, "weibull") qqPlot(x, "logistic") ดูเหมือนว่าพล็อต QQ สำหรับบันทึกปกติเกือบจะเหมือนกับพล็อต QQ สำหรับ weibull เราจะแยกแยะพวกมันได้อย่างไร นอกจากนี้หากคะแนนอยู่ในพื้นที่ที่กำหนดโดยเส้นสีดำด้านนอกสองเส้นนั่นแสดงว่ามันเป็นไปตามการแจกแจงที่ระบุหรือไม่?

2
การตีความผลลัพธ์ของ k-หมายถึงการจัดกลุ่มใน R
ฉันใช้kmeansคำสั่งของ R ในการดำเนินการอัลกอริธึม k-mean บนชุดข้อมูล iris ของ Anderson ฉันมีคำถามเกี่ยวกับพารามิเตอร์บางอย่างที่ฉันได้รับ ผลลัพธ์ที่ได้คือ: Cluster means: Sepal.Length Sepal.Width Petal.Length Petal.Width 1 5.006000 3.428000 1.462000 0.246000 ในกรณีนี้ "คลัสเตอร์หมายถึง" หมายถึงอะไร มันหมายถึงระยะทางของวัตถุทั้งหมดในกลุ่มหรือไม่ นอกจากนี้ในส่วนสุดท้ายฉันมี: Within cluster sum of squares by cluster: [1] 15.15100 39.82097 23.87947 (between_SS / total_SS = 88.4 %) ค่านั้น 88.4% สิ่งที่สามารถตีความได้?

3
ผลกระทบเล็กน้อยของรุ่น Probit และ Logit
ใครสามารถอธิบายวิธีการคำนวณผลกระทบส่วนเพิ่มของโมเดล Probit และ Logit ในแง่ของคนธรรมดา ฉันยังใหม่กับสถิติและฉันสับสนเกี่ยวกับแบบจำลองทั้งสองนี้

1
จะตีความสัมประสิทธิ์การถดถอยเชิงเส้นเชิงลบสำหรับตัวแปรผลลัพธ์ที่บันทึกไว้ได้อย่างไร?
ฉันมีรูปแบบการถดถอยเชิงเส้นที่ตัวแปรตามถูกบันทึกไว้และตัวแปรอิสระเป็นเชิงเส้น ค่าสัมประสิทธิ์ความลาดชันสำหรับตัวแปรอิสระที่สำคัญคือลบ: -.0564ไม่แน่ใจว่าจะตีความอย่างไร- .0564-0.0564-.0564 ฉันจะใช้ค่าสัมบูรณ์แล้วเปลี่ยนเป็นค่าลบเช่นนี้ ( ประสบการณ์( 0.0564 ) - 1 ) ⋅ 100 = 5.80(ประสบการณ์⁡(0.0564)-1)⋅100=5.80(\exp(0.0564)-1) \cdot 100 = 5.80 หรือ ฉันจะเสียบสัมประสิทธิ์เชิงลบเช่นนี้: ( ประสบการณ์( - 0.0564 ) - 1 ) ⋅ 100 = - 5.48(ประสบการณ์⁡(-0.0564)-1)⋅100=-5.48(\exp(-0.0564)-1) \cdot 100 = -5.48 กล่าวอีกนัยหนึ่งฉันจะใช้ตัวเลขสัมบูรณ์แล้วเปลี่ยนมันให้เป็นลบหรือฉันจะเสียบสัมประสิทธิ์เชิงลบหรือไม่? ฉันจะวลีที่ค้นพบของฉันในแง่ของการเพิ่มขึ้นหนึ่งหน่วยใน X ที่เกี่ยวข้องกับการลดลงร้อยละ __ ใน Y? อย่างที่คุณเห็นสูตรสองสูตรนี้ให้คำตอบที่ต่างกัน 2 ข้อ

1
ฉันสามารถสมมติความปกติ (log-) สำหรับตัวอย่างนี้ได้หรือไม่
นี่คือพล็อต QQ สำหรับตัวอย่างของฉัน (สังเกตแกนลอการิทึม Y) :n = 1,000n=1000n = 1000 ดังที่ได้กล่าวไว้โดย whuber สิ่งนี้บ่งชี้ว่าการกระจายที่แฝงอยู่นั้นเอียงไปทางซ้าย (หางขวาสั้นกว่า) shapiro.testW= 0.9718W=0.9718W = 0.97185.172 ⋅ 10- 135.172⋅10−135.172\cdot10^{-13}H0:the sample is normal distributedH0:the sample is normal distributedH_0 : \text{the sample is normal distributed} คำถามของฉันคือ: สิ่งนี้ดีพอในทางปฏิบัติสำหรับการวิเคราะห์เพิ่มเติมโดยสมมติว่า โดยเฉพาะอย่างยิ่งฉันต้องการคำนวณช่วงความเชื่อมั่นสำหรับวิธีการของตัวอย่างที่คล้ายกันโดยใช้วิธีการประมาณโดย Cox และที่ดิน (อธิบายไว้ในกระดาษ: Zou, GY, ซินดี้ Yan Huo และ Taleban, J. (2009) …

1
วิธีการตีความสัมประสิทธิ์ระยะที่สองในการถดถอยตัวแปรเครื่องมือด้วยเครื่องมือไบนารีและตัวแปรภายนอกไบนารี?
(โพสต์ค่อนข้างยาวขออภัยมีข้อมูลพื้นหลังมากมายดังนั้นโปรดข้ามไปที่คำถามด้านล่าง) Intro:ฉันกำลังทำงานในโครงการที่เรากำลังพยายามที่จะระบุผลกระทบของตัวแปรภายนอกไบนารีบนผลอย่างต่อเนื่องปีเราได้สร้างเครื่องมือขึ้นมาซึ่งเราเชื่อมั่นอย่างยิ่งว่าจะได้รับการมอบหมายแบบสุ่มx1x1x_1YyyZ1z1z_1 ข้อมูล:ข้อมูลอยู่ในโครงสร้างแผงซึ่งมีการสังเกตการณ์ประมาณ 34,000 ครั้งกระจายไปทั่ว 1,000 หน่วยและประมาณ 56 ช่วงเวลา ใช้ค่า 1 สำหรับการสังเกตประมาณ 700 (2%) และทำประมาณ 3000 (9%) 111 (0.33%) สังเกตคะแนน 1 ทั้งและและมันก็เป็นสองเท่าแนวโน้มสำหรับข้อสังเกตที่จะทำคะแนน 1ถ้ามันยังคะแนน 1 z_1x1x1x_1Z1z1z_1Z1z1z_1x1x1x_1x1x1x_1Z1z1z_1 การประมาณ:เราประเมินโมเดล 2SLS ต่อไปนี้ผ่านขั้นตอน ivreg2 ของ Stata: x1=π0+π1Z1+ Z π+ vx1=π0+π1z1+Zπ+vx_1 = \pi_0 + \pi_1z_1 + \mathbf{Z}\mathbf{\pi} + v Y=β0+β1x* * * *1+ Z β+ uy=β0+β1x1∗+Zβ+uy …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.