ฉันมีรูปแบบ
โดยที่คือตัวแปรที่ขึ้นต่อกันและเป็นตัวแปรอธิบายและเป็นพารามิเตอร์และเป็นคำผิดพลาด ฉันมีการประมาณพารามิเตอร์ของและและเมทริกซ์ความแปรปรวนร่วมของการประมาณเหล่านี้ ฉันจะทดสอบว่าและแตกต่างอย่างมีนัยสำคัญได้อย่างไร
ฉันมีรูปแบบ
โดยที่คือตัวแปรที่ขึ้นต่อกันและเป็นตัวแปรอธิบายและเป็นพารามิเตอร์และเป็นคำผิดพลาด ฉันมีการประมาณพารามิเตอร์ของและและเมทริกซ์ความแปรปรวนร่วมของการประมาณเหล่านี้ ฉันจะทดสอบว่าและแตกต่างอย่างมีนัยสำคัญได้อย่างไร
คำตอบ:
การประเมินสมมติฐานว่า และต่างกันเทียบเท่ากับการทดสอบสมมติฐานว่าง (เทียบกับทางเลือกที่ )
การวิเคราะห์ต่อไปนี้สันนิษฐานว่ามันสมเหตุสมผลสำหรับคุณที่จะประมาณเป็น นอกจากนี้ยังยอมรับการกำหนดโมเดลของคุณ (ซึ่งมักจะเป็นเหตุผลที่เหมาะสม) ซึ่ง - เนื่องจากข้อผิดพลาดนั้นเป็นสารเติมแต่ง (และอาจทำให้ค่าที่สังเกตได้เป็นลบของ ) - ไม่อนุญาตให้เราสร้างเส้นตรงโดยการลอการิทึมของทั้งสองฝ่าย
ความแปรปรวนของสามารถแสดงออกในแง่ของเมทริกซ์ความแปรปรวนร่วมของเป็น
เมื่อมีค่าประมาณกำลังสองน้อยที่สุดหนึ่งมักใช้ "t test;" นั่นคือการกระจายตัวของ เป็นค่าประมาณโดยการแจกแจงของนักเรียน tด้วยองศาอิสระ (โดยที่คือจำนวนข้อมูลและนับจำนวนสัมประสิทธิ์ ) โดยไม่คำนึงถึงมักเป็นพื้นฐานของการทดสอบใด ๆ คุณอาจทำการทดสอบ Z (เมื่อมีขนาดใหญ่หรือเมื่อเหมาะสมกับโอกาสสูงสุด) หรือบูตมันตัวอย่างเช่น
หากต้องการเจาะจงค่า p ของการทดสอบ t จะถูกกำหนดโดย
โดยที่เป็นฟังก์ชันการแจกแจง Student t (แบบสะสม) มันเป็นนิพจน์เดียวสำหรับ "พื้นที่หาง:" โอกาสที่ตัวแปร t นักเรียน (ขององศาอิสระ) เท่ากับหรือเกินกว่าขนาดของสถิติทดสอบ
โดยทั่วไปสำหรับตัวเลขและคุณสามารถใช้วิธีการเดียวกันเพื่อทดสอบสมมติฐานใด ๆ
กับทางเลือกสองด้าน (สิ่งนี้ครอบคลุมกรณีพิเศษ แต่แพร่หลายของ"ความแตกต่าง" ) ใช้เมทริกซ์ความแปรปรวนร่วม - ความแปรปรวนร่วมเพื่อประเมินความแปรปรวนของและสร้างสถิติ
ที่กล่าวมาคือกรณีและ
หากต้องการตรวจสอบว่าคำแนะนำนี้ถูกต้องฉันวิ่งต่อไปนี้R
รหัสในการสร้างข้อมูลตามรูปแบบนี้ (ที่มีข้อผิดพลาดปกติกระจายe
) พอดีกับพวกเขาและคำนวณค่าของหลายต่อหลายครั้ง ตรวจสอบว่าพล็อตความน่าจะเป็นของ (ขึ้นอยู่กับการแจกแจงของนักเรียน t) ตามแนวทแยงมุม นี่คือโครงเรื่องในการจำลองขนาดโดยที่ (ชุดข้อมูลขนาดเล็กมากเลือกเนื่องจากการแจกแจงอยู่ไกลจากปกติ) และ
ในตัวอย่างนี้อย่างน้อยกระบวนการทำงานได้อย่างสวยงาม ลองเรียกใช้การจำลองใหม่อีกครั้งโดยใช้พารามิเตอร์ (ส่วนเบี่ยงเบนมาตรฐานของข้อผิดพลาด) และที่สะท้อนถึงสถานการณ์ของคุณ
นี่คือรหัส
#
# Specify the true parameters.
#
set.seed(17)
a <- -1/2
b <- -1/2
sigma <- 0.25 # Variance of the errors
n <- 5 # Sample size
n.sim <- 500 # Simulation size
#
# Specify the hypothesis.
#
H.0 <- c(1, -1) # Coefficients of `a` and `b`.
mu <- 0
#
# Provide x and z values in terms of their logarithms.
#
log.x <- log(rexp(n))
log.z <- log(rexp(n))
#
# Compute y without error.
#
y.0 <- exp(a * log.x + b * log.z)
#
# Conduct a simulation to estimate the sampling distribution of the t statistic.
#
sim <- replicate(n.sim, {
#
# Add the errors.
#
e <- rnorm(n, 0, sigma)
df <- data.frame(log.x=log.x, log.z=log.z, y.0, y=y.0 + e)
#
# Guess the solution.
#
fit.ols <- lm(log(y) ~ log.x + log.z - 1, subset(df, y > 0))
start <- coefficients(fit.ols) # Initial values of (a.hat, b.hat)
#
# Polish it using nonlinear least squares.
#
fit <- nls(y ~ exp(a * log.x + b * log.z), df, list(a=start[1], b=start[2]))
#
# Test a hypothesis.
#
cc <- vcov(fit)
s <- sqrt((H.0 %*% cc %*% H.0))
(crossprod(H.0, coef(fit)) - mu) / s
})
#
# Display the simulation results.
#
summary(lm(sort(sim) ~ 0 + ppoints(length(sim))))
qqplot(qt(ppoints(length(sim)), df=n-2), sim,
pch=21, bg="#00000010", col="#00000040",
xlab="Student t reference value",
ylab="Test statistic")
abline(0:1, col="Red", lwd=2)