คำถามติดแท็ก p-value

ในการทดสอบสมมติฐานบ่อยครั้ง พี- ค่าคือความน่าจะเป็นของผลลัพธ์ที่รุนแรง (หรือมากกว่า) กว่าผลที่สังเกตได้ภายใต้สมมติฐานที่ว่าสมมติฐานว่างเป็นจริง

2
'' ตัวแปรที่สำคัญ '' ที่ไม่ได้ปรับปรุงการพยากรณ์นอกตัวอย่าง - จะตีความได้อย่างไร
ฉันมีคำถามที่ฉันคิดว่าจะค่อนข้างพื้นฐานสำหรับผู้ใช้จำนวนมาก ฉันใช้ตัวแบบการถดถอยเชิงเส้นเพื่อ (i) ตรวจสอบความสัมพันธ์ของตัวแปรอธิบายหลายตัวและตัวแปรตอบสนองของฉันและ (ii) ทำนายตัวแปรตอบสนองของฉันโดยใช้ตัวแปรอธิบาย ตัวแปรอธิบายอย่างใดอย่างหนึ่ง X ดูเหมือนจะส่งผลกระทบต่อตัวแปรตอบกลับของฉันอย่างมาก เพื่อทดสอบมูลค่าเพิ่มของตัวแปรอธิบายนี้เพื่อวัตถุประสงค์ในการคาดการณ์นอกตัวอย่างของตัวแปรตอบสนองของฉันฉันใช้สองแบบจำลอง: model (a) ซึ่งใช้ตัวแปรอธิบายและแบบจำลองทั้งหมด (b) ซึ่งใช้ตัวแปรทั้งหมด ยกเว้นตัวแปร X สำหรับทั้งสองรุ่นฉันรายงานประสิทธิภาพนอกตัวอย่างเท่านั้น ปรากฏว่าทั้งสองรุ่นมีประสิทธิภาพเกือบเหมือนกัน กล่าวอีกนัยหนึ่งการเพิ่มตัวแปรอธิบาย X ไม่ได้ปรับปรุงการพยากรณ์นอกตัวอย่าง โปรดทราบว่าฉันยังใช้ model (a) เช่นโมเดลที่มีตัวแปรอธิบายทั้งหมดเพื่อค้นหาว่าตัวแปรอธิบาย X ส่งผลกระทบอย่างมากต่อตัวแปรตอบกลับของฉัน คำถามของฉันคือ: จะตีความการค้นพบนี้ได้อย่างไร? ข้อสรุปที่ตรงไปตรงมาคือแม้ว่าตัวแปร X ดูเหมือนจะมีอิทธิพลต่อตัวแปรตอบสนองของฉันอย่างมีนัยสำคัญโดยใช้แบบจำลองที่อนุมานได้ แต่ก็ไม่ได้ปรับปรุงการทำนายนอกตัวอย่าง อย่างไรก็ตามฉันมีปัญหาในการอธิบายการค้นพบนี้เพิ่มเติม สิ่งนี้จะเป็นไปได้อย่างไรและอะไรคือคำอธิบายสำหรับการค้นพบนี้ ขอบคุณล่วงหน้า! ข้อมูลเพิ่มเติม: ด้วย 'อิทธิพลอย่างมีนัยสำคัญ' ฉันหมายความว่า 0 ไม่รวมอยู่ในช่วงความหนาแน่นหลังสูงสุด 95% ของการประมาณพารามิเตอร์ (ฉันใช้วิธีเบส์) ในแง่บ่อยๆสิ่งนี้มีความสัมพันธ์กับการมีค่า p ต่ำกว่า 0.05 …

1
จะตีความค่า P-GAM ได้อย่างไร?
ฉันชื่อฮิวจ์และฉันเป็นนักศึกษาปริญญาเอกโดยใช้แบบจำลองสารเติมแต่งทั่วไปเพื่อทำการวิเคราะห์เชิงสำรวจ ฉันไม่แน่ใจว่าจะตีความค่า p ที่มาจากแพ็คเกจ MGCV และต้องการตรวจสอบความเข้าใจของฉันได้อย่างไร (ฉันใช้รุ่น 1.7-29 และได้อ่านเอกสารของ Simon Wood แล้ว) ฉันค้นหาคำถาม CV อื่น ๆ ก่อน แต่คำถามที่เกี่ยวข้องที่สุดดูเหมือนจะเกี่ยวกับการถดถอยทั่วไปไม่ใช่ค่า p-GAM โดยเฉพาะ ฉันรู้ว่ามีอาร์กิวเมนต์ที่แตกต่างมากมายกับ GAM และค่า p เป็นค่าโดยประมาณเท่านั้น แต่ฉันเพิ่งเริ่มต้นง่ายๆเพื่อดูว่ามี "สัญญาณ" ใด ๆ สำหรับเพื่อนร่วมทุนของฉัน เช่น: Y ~ s (a, k = 3) + s (b, k = 3) + s (c, k = 3) …
10 p-value  mgcv 

2
ค่า P สำหรับเงื่อนไขการโต้ตอบในโมเดลเอฟเฟกต์แบบผสมโดยใช้ lme4
ผมวิเคราะห์ข้อมูลพฤติกรรมบางอย่างที่ใช้lme4ในRส่วนใหญ่ต่อไปนี้บทเรียนที่ดีเยี่ยมในโบเดอฤดูหนาวแต่ผมไม่เข้าใจว่าถ้าฉันจัดการการโต้ตอบอย่างถูกต้อง ที่แย่ไปกว่านั้นไม่มีใครที่เกี่ยวข้องในการวิจัยนี้ใช้แบบจำลองต่าง ๆ ดังนั้นฉันจึงไม่ค่อยมั่นใจเมื่อต้องแน่ใจว่าสิ่งต่าง ๆ ถูกต้อง แทนที่จะส่งเสียงร้องเพื่อขอความช่วยเหลือฉันคิดว่าฉันควรใช้ความพยายามอย่างเต็มที่เพื่อตีความปัญหาแล้วขอการแก้ไขโดยรวมของคุณ อีกสองสามคนคือผู้ช่วยคนอื่น ๆ : ในขณะที่เขียนผมพบคำถามนี้แสดงให้เห็นว่าnlmeขึ้นโดยตรงให้ค่า P สำหรับคำปฏิสัมพันธ์ lme4แต่ฉันคิดว่ามันยังคงถูกต้องที่จะขอให้มีความสัมพันธ์กับ Livius'คำตอบสำหรับคำถามนี้ให้ลิงก์ไปยังการอ่านเพิ่มเติมจำนวนมากซึ่งฉันจะพยายามผ่านในอีกไม่กี่วันข้างหน้าดังนั้นฉันจะแสดงความคิดเห็นกับความคืบหน้าใด ๆ ที่เกิดขึ้น ในข้อมูลของฉันฉันมีตัวแปรขึ้นอยู่กับdvการconditionจัดการ (0 = ควบคุม 1 = สภาพการทดลองซึ่งจะส่งผลให้สูงขึ้นdv) และยังจำเป็นป้ายappropriate: ทดลองรหัส1สำหรับการนี้ควรจะแสดงผล แต่การทดลองรหัส0ยุทธ ไม่ใช่เพราะปัจจัยสำคัญขาดหายไป ฉันยังได้รวมการสกัดแบบสุ่มสองรายการสำหรับsubjectและเพื่อtargetสะท้อนถึงdvค่าที่สัมพันธ์กันในแต่ละวิชาและภายใน 14 ปัญหาที่แก้ไข (ผู้เข้าร่วมแต่ละคนแก้ไขทั้งตัวควบคุมและเวอร์ชันทดลองของปัญหาแต่ละข้อ) library(lme4) data = read.csv("data.csv") null_model = lmer(dv ~ (1 | subject) + (1 | target), data = data) …

3
วิธีการรับค่า p ของสัมประสิทธิ์จากการถดถอย bootstrap?
จากQuick-Rของ Robert Kabacoff ฉันมี # Bootstrap 95% CI for regression coefficients library(boot) # function to obtain regression weights bs <- function(formula, data, indices) { d <- data[indices,] # allows boot to select sample fit <- lm(formula, data=d) return(coef(fit)) } # bootstrapping with 1000 replications results <- boot(data=mtcars, statistic=bs, R=1000, formula=mpg~wt+disp) …

1
การแก้ไข Hommel Hochberg คืออะไร
ฉันเพิ่งได้รับการแนะนำให้รู้จักกับการแก้ไข Hommel Hochberg ฉันกำลังพยายามหาคำอธิบายง่ายๆเกี่ยวกับสิ่งนี้ / ทำจริง ๆ แต่ไม่มีโชค ใครช่วยกรุณาให้คำอธิบายสั้น ๆ และง่าย ๆ เกี่ยวกับการแก้ไข Hommel Hochberg?

1
ประโยชน์ของการใช้การทดสอบการเปลี่ยนรูปคืออะไร?
เมื่อทำการทดสอบสมมติฐานบางตัวเทียบกับสมมติฐานทางเลือกโดยสถิติทดสอบโดยที่ให้ใช้การทดสอบการเปลี่ยนรูปกับชุดของการเปลี่ยนลำดับบนและเรามีสถิติใหม่ ยู( X)U(X)U(X)X= {xผม, . . . ,xn}X={xi,...,xn}X = \{ x_i, ..., x_n\}GGGXXXT( X) : =# { π∈ G : U( πX) ≥ คุณ( X) }| G |.T(X):=#{π∈G:U(πX)≥U(X)}|G|. T(X) := \frac{\# \{\pi \in G: U(\pi X) \geq U(X)\}}{|G|}. ประโยชน์ของการใช้แบบทดสอบการเปลี่ยนรูปมากกว่าไม่ใช้มันคืออะไร? คือเมื่อการทดสอบการเรียงสับเปลี่ยนทำงานอย่างไร มีเงื่อนไขอะไรที่จะทำให้เกิดขึ้น เช่นเงื่อนไขบางอย่างในสถิติการทดสอบและ / หรือตามสมมติฐานว่าง?ยูUU ตัวอย่างเช่น, ควร เท่ากับ p-value ขึ้นอยู่กับสำหรับตัวอย่าง ? …

6
การใช้ค่า p เพื่อคำนวณความน่าจะเป็นของสมมติฐานที่เป็นจริง ต้องการอะไรอีก
คำถาม: ความเข้าใจผิดอย่างหนึ่งที่พบบ่อยของค่า p คือพวกมันเป็นตัวแทนของความน่าจะเป็นของสมมติฐานว่างเปล่าที่เป็นจริง ฉันรู้ว่าไม่ถูกต้องและฉันรู้ว่าค่า p แสดงถึงความน่าจะเป็นในการหาตัวอย่างมากเช่นนี้เนื่องจากสมมติฐานว่างเป็นจริง อย่างไรก็ตามอย่างสังหรณ์ใจคนหนึ่งควรจะได้รับมาจากคนหลัง ต้องมีเหตุผลว่าทำไมไม่มีใครทำเช่นนี้ ข้อมูลใดที่เราขาดหายไปซึ่ง จำกัด เราจากการได้รับความน่าจะเป็นของสมมติฐานที่เป็นจริงจากค่า p และข้อมูลที่เกี่ยวข้อง? ตัวอย่าง: สมมติฐานของเราคือ "วิตามินดีส่งผลต่ออารมณ์" (สมมติฐานว่างเปล่าว่าเป็น "ไม่มีผล") สมมติว่าเราทำการศึกษาทางสถิติที่เหมาะสมกับ 1,000 คนและค้นหาความสัมพันธ์ระหว่างอารมณ์และระดับวิตามิน สิ่งอื่น ๆ ที่เท่าเทียมกันค่า p-0.01 บ่งชี้ความเป็นไปได้ของสมมติฐานที่แท้จริงสูงกว่าค่า p-0.05 สมมุติว่าเราได้ค่า p เป็น 0.05 ทำไมเราไม่สามารถคำนวณความน่าจะเป็นจริงที่สมมติฐานของเราเป็นจริงได้ ข้อมูลอะไรที่เราขาดหายไป? คำศัพท์สำรองสำหรับนักสถิติประจำ: หากคุณยอมรับหลักฐานของคำถามของฉันคุณสามารถหยุดอ่านได้ที่นี่ ต่อไปนี้สำหรับผู้ที่ปฏิเสธที่จะยอมรับว่าสมมติฐานสามารถมีการตีความความน่าจะเป็น เรามาลืมคำศัพท์กันสักครู่ แทน... สมมติว่าคุณกำลังเดิมพันกับเพื่อนของคุณ เพื่อนของคุณแสดงการศึกษาทางสถิตินับพันเกี่ยวกับวิชาที่ไม่เกี่ยวข้อง สำหรับการศึกษาแต่ละครั้งคุณจะได้รับอนุญาตให้ดูที่ p-value ขนาดตัวอย่างและค่าเบี่ยงเบนมาตรฐานของตัวอย่าง สำหรับการศึกษาแต่ละครั้งเพื่อนของคุณเสนอโอกาสที่จะเดิมพันว่าสมมติฐานที่นำเสนอในการศึกษาเป็นจริง คุณสามารถเลือกที่จะเดิมพันหรือไม่ก็ได้ หลังจากที่คุณทำการเดิมพันสำหรับการศึกษาทั้งหมด 1,000 ครั้งแล้วออราเคิลก็ขึ้นไปหาคุณและบอกคุณว่าสมมติฐานใดถูกต้อง ข้อมูลนี้ช่วยให้คุณสามารถตัดสินการเดิมพัน …

1
ความเท่าเทียมกันของ AIC และ p-values ​​ในการเลือกแบบจำลอง
ในความคิดเห็นต่อคำตอบของคำถามนี้พบว่าการใช้ AIC ในการเลือกแบบจำลองนั้นเทียบเท่ากับการใช้ค่า p-0.154 ฉันลองใน R ที่ฉันใช้อัลกอริทึมการเลือกชุดย่อย "ย้อนกลับ" เพื่อโยนตัวแปรออกจากสเปคแบบเต็ม ครั้งแรกโดยการทิ้งตัวแปรที่มีค่า p-value สูงสุดและหยุดเมื่อ p-value ทั้งหมดต่ำกว่า 0.154 และอันดับที่สองโดยการวางตัวแปรซึ่งส่งผลให้ AIC ต่ำที่สุดเมื่อถูกลบออกจนกว่าจะไม่มีการปรับปรุงใด ๆ ปรากฎว่าพวกเขาให้ผลลัพธ์แบบคร่าวๆเมื่อฉันใช้ค่า p-0.154 เป็นเกณฑ์ จริงหรือไม่ ถ้ามีใครรู้ว่าทำไมหรือสามารถอ้างถึงแหล่งที่อธิบายได้ ป.ล. ฉันไม่สามารถถามคนที่แสดงความคิดเห็นหรือเขียนความเห็นได้เพราะเพิ่งสมัครใช้งาน ฉันรู้ว่านี่ไม่ใช่วิธีที่เหมาะสมที่สุดในการเลือกแบบจำลองและการอนุมานเป็นต้น

2
ทำไม 0.05 <p <0.95 ผลลัพธ์จึงเรียกว่าผลบวกผิด?
แก้ไข:พื้นฐานของคำถามของฉันมีข้อบกพร่องและฉันจำเป็นต้องใช้เวลาในการพิจารณาว่าจะสามารถทำให้เข้าใจได้หรือไม่ แก้ไข 2:ชี้แจงว่าฉันรับรู้ว่า p-value ไม่ใช่การวัดโดยตรงของความน่าจะเป็นของสมมติฐานว่าง แต่ฉันสมมติว่ายิ่งค่า p-value ใกล้ถึง 1 ยิ่งมีโอกาสมากขึ้นที่สมมติฐานจะมี ถูกเลือกสำหรับการทดสอบทดลองที่มีสมมติฐานว่างตรงกันเป็นจริงในขณะที่ค่า p-value ใกล้เคียงกับ 0 ยิ่งมีโอกาสมากขึ้นที่จะมีการเลือกสมมติฐานสำหรับการทดสอบทดลองที่มีสมมติฐานว่างเป็นเท็จ ฉันไม่สามารถเห็นได้ว่านี่เป็นความผิดอย่างไรเว้นแต่ชุดของสมมติฐานทั้งหมด (หรือสมมติฐานทั้งหมดที่เลือกสำหรับการทดลอง) เป็นพยาธิสภาพ แก้ไข 3:ฉันคิดว่าฉันยังไม่ได้ใช้คำศัพท์ที่ชัดเจนเพื่อถามคำถามของฉัน เมื่อตัวเลขลอตเตอรีถูกอ่านออกมาและคุณจับคู่กับตั๋วของคุณทีละรายการการเปลี่ยนแปลงบางอย่าง ความน่าจะเป็นที่คุณชนะไม่เปลี่ยนแปลง แต่ความน่าจะเป็นที่คุณสามารถปิดวิทยุได้ มีการเปลี่ยนแปลงที่คล้ายกันซึ่งเกิดขึ้นเมื่อทำการทดลอง แต่ฉันมีความรู้สึกว่าคำศัพท์ที่ฉันใช้ - "ค่า p เปลี่ยนโอกาสในการเลือกสมมติฐานที่แท้จริง" - ไม่ใช่คำศัพท์ที่ถูกต้อง แก้ไข 4:ฉันได้รับคำตอบอย่างละเอียดและให้ข้อมูลที่น่าอัศจรรย์สองอย่างที่มีข้อมูลมากมายให้ฉันทำงาน ฉันจะโหวตให้พวกเขาทั้งคู่แล้วและกลับมาตอบรับเมื่อฉันได้เรียนรู้มากพอจากคำตอบทั้งสองเพื่อที่จะรู้ว่าพวกเขาตอบหรือทำให้คำถามของฉันไม่ถูกต้อง คำถามนี้เปิดเวิร์มกระป๋องที่ใหญ่กว่าที่ฉันคาดไว้กินมาก ในเอกสารที่ฉันอ่านฉันได้เห็นผลลัพธ์ด้วย p&gt; 0.05 หลังจากการตรวจสอบความถูกต้องที่เรียกว่า "ผลบวกปลอม" อย่างไรก็ตามมันก็ยังไม่น่าเป็นไปได้มากกว่าที่ฉันได้เลือกสมมติฐานเพื่อทดสอบด้วยสมมติฐานว่างที่สอดคล้องกันเท็จเมื่อข้อมูลการทดลองมี ap &lt;0.50ซึ่งต่ำ แต่&gt; 0.05 และไม่ใช่ทั้งสมมติฐานว่างและ สมมติฐานการวิจัยมีความไม่แน่นอน / ไม่มีนัยสำคัญทางสถิติ (จากการตัดนัยสำคัญทางสถิติแบบธรรมดา) …

1
ความหมายของ p-value ของตัวแปรตัวแบบการถดถอยโลจิสติก
ดังนั้นฉันจึงทำงานกับแบบจำลองการถดถอยโลจิสติกในอาร์แม้ว่าฉันจะยังใหม่กับสถิติฉันรู้สึกว่าฉันมีความเข้าใจเล็กน้อยเกี่ยวกับแบบจำลองการถดถอยในตอนนี้ แต่ยังมีบางสิ่งที่รบกวนฉัน: เมื่อมองไปที่รูปภาพที่เชื่อมโยงคุณจะเห็นสรุป R พิมพ์สำหรับรุ่นตัวอย่างที่ฉันสร้างขึ้น รูปแบบการพยายามที่จะคาดการณ์ว่าอีเมลในชุดข้อมูลที่จะได้รับการ refound หรือไม่ (ตัวแปรไบนารีisRefound) และชุดข้อมูลที่มีสองตัวแปรที่เกี่ยวข้องอย่างใกล้ชิดกับisRefoundคือnext24และnext7days- เหล่านี้เป็นยังไบนารีและบอกได้ว่า mail จะได้รับการคลิกในครั้งต่อไป 24 ชั่วโมง / 7 วันถัดจากจุดปัจจุบันในบันทึก ค่า p สูงควรระบุว่าผลกระทบที่ตัวแปรนี้มีต่อการทำนายแบบจำลองนั้นค่อนข้างสุ่มใช่ไหม? จากนี้ฉันไม่เข้าใจว่าทำไมความแม่นยำของแบบจำลองการคาดการณ์จึงลดลงต่ำกว่า 10% เมื่อตัวแปรสองตัวนี้ไม่ได้อยู่ในสูตรการคำนวณ หากตัวแปรเหล่านี้แสดงความสำคัญต่ำทำไมการลบออกจากแบบจำลองมีผลกระทบอย่างมาก ขอแสดงความนับถือและขอขอบคุณล่วงหน้า Rickyfox แก้ไข: ครั้งแรกที่ฉันลบเฉพาะ next24 ซึ่งควรให้ผลกระทบต่ำเพราะ coef มันค่อนข้างเล็ก ตามที่คาดไว้มีการเปลี่ยนแปลงเล็กน้อย - ไม่ต้องอัปโหลดรูปภาพสำหรับสิ่งนั้น การลบรุ่นถัดไป 7 วันมีผลกระทบอย่างมากต่อโมเดล: AIC 200k ขึ้นไปความแม่นยำลดลงถึง 16% และเรียกคืนได้ถึง 73%

1
การคำนวณค่า p ที่ไม่รู้จัก
ฉันเพิ่งแก้ไขจุดบกพร่องสคริปต์ R และพบสิ่งแปลกประหลาดมากผู้เขียนกำหนดฟังก์ชั่นค่า p ของตัวเอง pval &lt;- function(x, y){ if (x+y&lt;20) { # x + y is small, requires R.basic p1&lt;- nChooseK(x+y,x) * 2^-(x+y+1); p2&lt;- nChooseK(x+y,y) * 2^-(x+y+1); pvalue = max(p1, p2) } else { # if x+y is large, use approximation log_p1 &lt;- (x+y)*log(x+y) - x*log(x) - y*log(y) - …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.