วิธีทดสอบว่า“ สถานะก่อนหน้า” มีอิทธิพลต่อ“ สถานะต่อมา” ใน R หรือไม่


10

ลองนึกภาพสถานการณ์: เรามีบันทึกทางประวัติศาสตร์ (20 ปี) จากเหมืองสามแห่ง การมีเงินอยู่เพิ่มความน่าจะเป็นในการค้นหาทองคำในปีหน้าหรือไม่? วิธีทดสอบคำถามดังกล่าว


ป้อนคำอธิบายรูปภาพที่นี่

นี่คือข้อมูลตัวอย่าง:

mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
            "rock","rock","rock","rock","silver","rock","rock",
            "rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
            "silver","gold","gold","gold","gold","gold","rock",
            "silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
            "rock","silver","rock","rock","rock","rock","silver",
            "gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)


1
คุณอาจจะสนใจในการคำนวณการฝึกอบรมการเปลี่ยนแปลง
Andy W

สวัสดี @AndyW! ขอบคุณสำหรับความคิดเห็น ฉันคุ้นเคยกับแพคเกจเมทริกซ์การเปลี่ยนแปลง: makkovchain - markovchainFit () ฉันสามารถใช้ค่าความน่าจะเป็นจากเมทริกซ์การเปลี่ยนแปลงเป็นค่า p ได้หรือไม่ มีวิธีใดที่จะทดสอบสมมติฐาน: "มีความสัมพันธ์" เงิน - ทอง "อยู่ (p-value = xx)?
Ladislav Naďo

1
@LadislavNado ความน่าจะเป็นในการเปลี่ยนแปลงไม่สามารถตีความได้ว่าเป็นค่า p (พวกเขาไม่ได้บอกอะไรคุณเกี่ยวกับการปฏิเสธ H0 ใด ๆ ), ดูstats.stackexchange.com/questions/31/…เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับค่า p
ทิม

1
ฉันเห็นปัญหาเกี่ยวกับวิธีการที่คุณดึงข้อมูลของคุณ พิจารณาสถานการณ์ "เงิน: ไม่ใช่" & "ทองคำ: ใช่" คุณควรนับการวิ่งต่อเนื่องของ "ทองคำ" เนื่องจากเป็นไปตามเกณฑ์ตรรกะ

1
ด้วยเซลล์เดียวที่แก้ไขจาก 1 เป็น 14 โมเดลจะเปลี่ยนเป็น: ค่าสัมประสิทธิ์: Estimate Std ข้อผิดพลาดค่า z Pr (> | z |) (สกัดกั้น) -1.2528 0.8018 -1.562 0.118 as.factor (c (0, 1)) 1 0.3655 0.8624 0.424 0.672

คำตอบ:


4

ความพยายามที่ดีที่สุดของฉัน: ... การใช้เมทริกซ์การเปลี่ยนแปลงที่แนะนำโดย @AndyW อาจไม่ใช่วิธีที่ฉันกำลังมองหา (อิงจากความคิดเห็นของ @ Tim) ดังนั้นฉันจึงลองวิธีอื่น ฉันพบการเชื่อมโยงที่เกี่ยวข้องกับวิธีการทำถดถอยโลจิสติที่ตัวแปร y การตอบสนองและตัวแปรทำนาย x มีทั้งแบบไบนารี

ตามตัวอย่างฉันควรสร้างตาราง 2 × 2 ตามข้อมูลของฉัน:

               gold (yes)  gold (no)
silver (yes)       2           7
silver (no)       14          34

ฉันจะแยกค่าได้อย่างไร: ป้อนคำอธิบายรูปภาพที่นี่

และสร้างแบบจำลอง:

response <- cbind(yes = c(2, 14), no = c(7, 34))

mine.logistic <- glm(response ~ as.factor(c(0,1)),
                      family = binomial(link=logit))

summary(mine.logistic)
# Coefficients:
#                     Estimate Std. Error z value Pr(>|z|)
# (Intercept)          -1.2528     0.8018  -1.562    0.118
# as.factor(c(0, 1))1   0.3655     0.8624   0.424    0.672

มันเป็นทางออกที่ดีหรือไม่? ค่า p (0.673) หมายความว่าการมีอยู่ของเงินไม่เพิ่มความน่าจะเป็นในการค้นหาทองคำหรือไม่?


คุณสร้างแผนภูมิที่ดีเหล่านี้ได้อย่างไร Tikz?
shadowtalker

สวัสดี @ssdecontrol! แผนภูมิถูกสร้างขึ้นด้วยมือใน Inkscape
Ladislav Naďo

ใช่นั่นเป็นการตีความที่ดี นอกจากนี้หากคุณดูที่แถวของตาราง 2x2 ของคุณที่แถวบนสุด (เงิน: ใช่) คุณมี 9 รายซึ่งมี 2 กรณีที่มีทองดังนั้นความน่าจะเป็นที่จะได้รับเงินในปีหน้าคือ 2/9 = 0.222 แถวล่างสุด (เงิน: ไม่) คุณมี 48 ราย 14 กรณีที่มีทองในปีหน้าดังนั้นจึงไม่มีความน่าจะเป็นที่ทำเงินได้คือ 14 / (14 + 34) = 0.292 จากที่กล่าวมาทั้งหมดดูเหมือนว่าเงินจะทำให้คุณมีโอกาสหาทองคำแม้ว่าค่า p ของคุณจะไม่ "มีนัยสำคัญทางสถิติ"
Gregor Thomas

ระวังการเข้ารหัสของคุณคุณเริ่มด้วยyes = c(2, 14), no = c(7, 34)ซึ่งหมายความว่าการใส่เงินของคุณ: ใช่ก่อน ดังนั้นเมื่อคุณทำas.factor(c(0, 1))0 สอดคล้องกับเงิน: ใช่ซึ่งเป็นระดับอ้างอิงของคุณและทำให้การสกัดกั้นของคุณ ค่า 0.67 p สอดคล้องกับการชนในเชิงบวกเล็ก ๆ ที่คุณจะได้รับจากการหาทองที่เคลื่อนที่จากเงิน: ใช่เป็นเงิน: ไม่
Gregor Thomas

หนึ่งความคิดเห็นล่าสุด: คุณกำลังใช้เมทริกซ์การเปลี่ยนแปลง เมทริกซ์ 2, 7, 14, 34 ของคุณเป็นเมทริกซ์การเปลี่ยนแปลง
Gregor Thomas
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.