คำถามติดแท็ก hypothesis-testing

การทดสอบสมมติฐานจะประเมินว่าข้อมูลไม่สอดคล้องกับสมมติฐานที่กำหนดแทนที่จะเป็นผลของความผันผวนแบบสุ่มหรือไม่

2
เราสามารถยอมรับค่าว่างในการทดสอบที่ไม่ได้มาหรือไม่?
ในวิธีทดสอบ t-test ปกติโดยใช้วิธีการทดสอบสมมติฐานตามปกติเราอาจปฏิเสธโมฆะหรือไม่สามารถปฏิเสธโมฆะ แต่เราไม่เคยยอมรับโมฆะ เหตุผลหนึ่งสำหรับเรื่องนี้คือถ้าเราได้รับหลักฐานมากขึ้นขนาดของเอฟเฟกต์เดียวกันจะกลายเป็นสิ่งสำคัญ แต่จะเกิดอะไรขึ้นในการทดสอบความไม่ได้ตัวตน? นั่นคือ: H0:μ1−μ0≤xH0:μ1−μ0≤xH_0: \mu_1 - \mu_0 \le x เมื่อเทียบกับ H1:μ1−μ0>xH1:μ1−μ0>xH_1: \mu_1 - \mu_0 > x โดยที่คือจำนวนเงินที่เราพิจารณาว่าเป็นสิ่งเดียวกัน ดังนั้นถ้าเราปฏิเสธโมฆะเราบอกว่ามีค่ามากกว่าอย่างน้อยxเราไม่สามารถปฏิเสธโมฆะหากมีหลักฐานไม่เพียงพอ xxxμ1μ1\mu_1μ0μ0\mu_0xxx หากขนาดของเอฟเฟกต์เป็นหรือมากกว่านั้นจะมีความคล้ายคลึงกับการทดสอบแบบปกติ แต่ถ้าขนาดเอฟเฟกต์น้อยกว่าในตัวอย่างที่เรามี จากนั้นหากเราเพิ่มขนาดตัวอย่างและคงระดับเดิมไว้ ในกรณีนี้เราสามารถยอมรับค่าว่างได้หรือไม่?xxxxxx

5
สถิติการทดสอบของเดอร์บินวัตสัน
ฉันใช้การทดสอบ DW กับโมเดลการถดถอยของฉันใน R และฉันได้สถิติการทดสอบ DW ที่ 1.78 และค่า p เท่ากับ 2.2e-16 = 0 นี่หมายความว่าไม่มีความสัมพันธ์อัตโนมัติระหว่างส่วนที่เหลือเพราะสถิติอยู่ใกล้กับ 2 ด้วยค่า p เล็ก ๆ หรือหมายความว่าแม้ว่าสถิติใกล้เคียงกับ 2 ค่า p มีค่าน้อยดังนั้นเราจึงปฏิเสธสมมติฐานว่างที่มีอยู่ ไม่มีความสัมพันธ์อัตโนมัติ?

2
ทำไมเนย์แมน - เพียร์สันบทแทรกบทแทรกและไม่ใช่ทฤษฎีบท?
นี่เป็นคำถามประวัติมากกว่าคำถามทางเทคนิค ทำไมเนย์แมน - เพียร์สันบทแทรกบทเล็มม่าไม่ใช่ทฤษฎีบท ลิงก์ไปยังวิกิ: https://en.wikipedia.org/wiki/Neyman%E2%80%93Pearson_lemma หมายเหตุ : คำถามไม่ได้เกี่ยวกับบทแทรกคืออะไรและวิธีใช้บทแทรกเพื่อพิสูจน์ทฤษฎีบท แต่เกี่ยวกับประวัติของบทแทรกของ Neyman-Pearson มันใช้เพื่อพิสูจน์ทฤษฎีบทแล้วมันเกิดประโยชน์มากขึ้นหรือไม่? มีหลักฐานใด ๆ เกี่ยวกับเรื่องนี้นอกเหนือจากความสงสัยว่าเป็นกรณีนี้หรือไม่?

1
การทดสอบ Signed-Rank Test ของ Wilcoxon จะดีกว่าแบบทดสอบ t-Test หรือ Sign Test อย่างไร
หลังจากการสนทนาบางส่วน (ด้านล่าง) ตอนนี้ฉันมีภาพที่ชัดเจนของคำถามที่มุ่งเน้นดังนั้นนี่คือคำถามที่ได้รับการแก้ไขแม้ว่าความคิดเห็นบางส่วนอาจดูเหมือนไม่เกี่ยวข้องกับคำถามเดิม ดูเหมือนว่าการทดสอบแบบ t- มาบรรจบกันอย่างรวดเร็วสำหรับการแจกแจงแบบสมมาตรซึ่งการทดสอบแบบลงนามจะถือว่าสมมาตรและสำหรับการกระจายแบบสมมาตรนั้นไม่แตกต่างกันระหว่างค่าเฉลี่ย / pseudomedians / ค่ามัธยฐาน ถ้าเป็นเช่นนั้นภายใต้สถานการณ์ใดนักสถิติที่ไม่มีประสบการณ์ค่อนข้างจะพบว่าการทดสอบแบบมีลายเซ็นมีประโยชน์เมื่อเขา / เธอมีทั้งแบบทดสอบ t-test และทดสอบแบบลงชื่อ? หากหนึ่งในนักเรียนของฉัน (เช่นสังคมศาสตร์) กำลังพยายามทดสอบว่าการรักษาหนึ่งทำได้ดีกว่าอีกหรือไม่ (โดยการวัดที่ค่อนข้างง่ายตีความเช่นความคิดของความแตกต่าง "เฉลี่ย") ฉันกำลังดิ้นรนเพื่อหาสถานที่สำหรับการเซ็นชื่อ - การทดสอบยศแม้ว่าโดยทั่วไปแล้วดูเหมือนว่าจะได้รับการสอนและการทดสอบการลงชื่อก็ไม่สนใจในมหาวิทยาลัยของฉัน

2
คำขออ้างอิง: สถิติคลาสสิคสำหรับนักวิทยาศาสตร์ด้านข้อมูลการทำงาน
ฉันเป็นนักวิทยาศาสตร์ข้อมูลที่ทำงานด้วยประสบการณ์ที่แข็งแกร่งในการถดถอยอัลกอริธึมชนิดการเรียนรู้ของเครื่องอื่น ๆ และการเขียนโปรแกรม (ทั้งสำหรับการวิเคราะห์ข้อมูลและการพัฒนาซอฟต์แวร์ทั่วไป) ชีวิตการทำงานส่วนใหญ่ของฉันมุ่งเน้นไปที่การสร้างแบบจำลองเพื่อความแม่นยำในการคาดการณ์ (ทำงานภายใต้ข้อ จำกัด ทางธุรกิจต่าง ๆ ) และการสร้างท่อส่งข้อมูลเพื่อสนับสนุนงานของฉันเอง ฉันไม่มีสถิติการฝึกอบรมอย่างเป็นทางการการศึกษาในมหาวิทยาลัยของฉันเน้นที่คณิตศาสตร์บริสุทธิ์ เช่นนี้ทำให้พลาดการเรียนรู้หัวข้อคลาสสิกจำนวนมากโดยเฉพาะการทดสอบสมมติฐานยอดนิยมต่างๆและเทคนิคการอนุมาน มีการอ้างอิงใด ๆ สำหรับหัวข้อเหล่านี้ที่เหมาะสำหรับใครบางคนที่มีพื้นฐานและระดับประสบการณ์หรือไม่? ฉันสามารถจัดการ (และชื่นชม) ความแม่นยำทางคณิตศาสตร์และเพลิดเพลินไปกับมุมมองอัลกอริทึม ฉันมักจะชอบอ้างอิงที่เสนอแบบฝึกหัดที่มีผู้อ่านซึ่งมีทั้งแบบ (หรืออย่างใดอย่างหนึ่ง) โฟกัสการเขียนโปรแกรมทางคณิตศาสตร์และ (หรือ)

6
เราจะทราบความแปรปรวนของประชากรได้อย่างไร?
ในการทดสอบสมมติฐานคำถามทั่วไปคือความแปรปรวนของประชากรคืออะไร? คำถามของฉันคือเราจะทราบความแปรปรวนของประชากรได้อย่างไร ถ้าเรารู้การกระจายตัวทั้งหมดเราก็อาจรู้ค่าเฉลี่ยของประชากรทั้งหมด จากนั้นการทดสอบสมมติฐานคืออะไร?

5
วิธีการทดสอบเอฟเฟกต์ปฏิสัมพันธ์กับการทดสอบที่ไม่ใช่พารามิเตอร์ (เช่นการทดสอบการเปลี่ยนแปลง)
ฉันมีตัวแปรเด็ดขาด / สองเล็กน้อย แต่ละคนสามารถรับค่าที่แตกต่างกันเพียงสองค่าเท่านั้น (ดังนั้นฉันจึงมีทั้งหมด 4 แบบ) การรวมกันของค่าแต่ละค่ามาพร้อมกับชุดของค่าตัวเลข ดังนั้นฉันมีตัวเลข 4 ชุด เพื่อให้เป็นรูปธรรมมากขึ้นขอให้เราบอกว่าฉันมีmale / femaleและyoung / oldเป็นตัวแปรที่กำหนดและฉันมีweight"เอาท์พุท" เชิงตัวเลข ฉันรู้ว่าการเปลี่ยนจากmaleเป็นfemaleเปลี่ยนน้ำหนักเฉลี่ยและการเปลี่ยนแปลงเหล่านี้มีนัยสำคัญทางสถิติ ดังนั้นฉันสามารถคำนวณgenderปัจจัย เช่นเดียวกับageตัวแปร ฉันรู้ว่าการเปลี่ยนจากyoungเป็นoldเปลี่ยนน้ำหนักเฉลี่ยและฉันสามารถคำนวณageปัจจัยที่เกี่ยวข้องได้ ตอนนี้สิ่งที่ฉันต้องการดูว่าข้อมูลพิสูจน์ให้เห็นว่าการเปลี่ยนจากหญิงสาวเป็นชายชราเป็นมากกว่าการรวมกันของเพศ - และปัจจัยอายุ กล่าวอีกนัยหนึ่งฉันต้องการทราบว่าข้อมูลพิสูจน์ว่ามี "เอฟเฟ็กต์ 2 มิติ" หรือกล่าวอีกนัยหนึ่งว่าเอฟเฟกต์อายุและเพศไม่ได้เป็นอิสระ ตัวอย่างเช่นอาจเป็นเรื่องเก่าสำหรับผู้ชายที่เพิ่มน้ำหนักตามปัจจัย 1.3 และสำหรับผู้หญิงปัจจัยที่เกี่ยวข้องคือ 1.1 แน่นอนฉันสามารถคำนวณสองปัจจัยที่กล่าวถึง (ปัจจัยอายุสำหรับผู้ชายและปัจจัยอายุสำหรับผู้หญิง) และพวกเขาจะแตกต่างกัน แต่ฉันต้องการคำนวณนัยสำคัญทางสถิติของความแตกต่างนี้ ความแตกต่างนี้จริงแค่ไหน ฉันต้องการทำแบบทดสอบที่ไม่ใช่พารามิเตอร์หากเป็นไปได้ เป็นไปได้ไหมที่จะทำสิ่งที่ฉันต้องการจะทำโดยการผสมทั้งสี่เซตสับมันแบ่งอีกครั้งและคำนวณบางอย่าง

3
ทดสอบการเชื่อมโยงสำหรับ DV ที่กระจายตามปกติโดยตัวแปรอิสระในทิศทางหรือไม่
มีการทดสอบสมมติฐานว่าตัวแปรตามที่กระจายตามปกติมีความสัมพันธ์กับตัวแปรกระจายตามทิศทางหรือไม่? ตัวอย่างเช่นหากเวลาของวันเป็นตัวแปรอธิบาย (และสมมติว่าสิ่งต่าง ๆ เช่นวันของสัปดาห์เดือนของปี ฯลฯ ไม่เกี่ยวข้อง) - นั่นคือวิธีการบัญชีสำหรับความจริงที่ว่า 23:00 เป็น 22 ชั่วโมงข้างหน้าของ 1am และ 2 ชั่วโมงหลัง 1am ในการทดสอบของสมาคมหรือไม่ ฉันสามารถทดสอบว่าเวลาต่อเนื่องของวันอธิบายตัวแปรตามหรือไม่โดยไม่คิดว่าเวลาเที่ยงคืน 12:00 ไม่เป็นไปตามเวลาหนึ่งนาทีหลัง 23.59 น. หรือไม่ การทดสอบนี้ใช้กับตัวแปรอธิบายแบบแยกส่วนได้หรือไม่? หรือว่าต้องมีการทดสอบแยกต่างหาก ตัวอย่างเช่นวิธีการทดสอบว่าตัวแปรตามขึ้นอยู่กับการอธิบายตามเดือนของปี (สมมติว่าวันและฤดูกาลของปีและปีที่เฉพาะเจาะจงหรือทศวรรษที่ไม่เกี่ยวข้อง) การรักษาเดือนของปีอย่างเด็ดขาดละเว้นการสั่งซื้อ แต่การรักษาเดือนของปีเป็นตัวแปรลำดับมาตรฐาน (พูด ม.ค. = 1 ... ธันวาคม = 12) ไม่สนใจว่าเดือนมกราคมจะมาสองเดือนหลังจากเดือนพฤศจิกายน

2
เหตุใดข้อผิดพลาดประเภท II จึงไม่เน้นในวรรณคดีเชิงสถิติมากนัก
ฉันได้เห็นหลายกรณีที่ข้อผิดพลาดประเภท I ถูกนำมาใช้ (แสดงโดยค่าอัลฟา) ในบทความวิจัยต่างๆ ฉันพบว่าหายากที่นักวิจัยจะพิจารณาถึงพลังหรือข้อผิดพลาดของ type II ข้อผิดพลาด Type II สามารถเป็นเรื่องใหญ่ใช่มั้ย เราได้ปฏิเสธสมมติฐานทางเลือกโดยบังเอิญเมื่อมันผิดจริง ทำไมค่าอัลฟาจึงถูกเน้นย้ำมากกว่าค่าเบต้า เมื่อฉันใช้สถิติปีแรกฉันไม่เคยได้รับการสอนเบต้า - อัลฟ่าเท่านั้น ฉันรู้สึกว่าข้อผิดพลาดสองข้อนี้ควรได้รับการปฏิบัติอย่างเท่าเทียมกัน ทว่าอัลฟ่าเท่านั้นที่จะถูกเน้น

3
ฉันสามารถใช้วิธีการทางสถิติเพื่อค้นหาชุดค่าผสมที่นิยมหรือร่วมกันของตัวแปรเด็ดขาดได้อย่างไร
ฉันกำลังศึกษาเรื่องการใช้ polydrug ฉันมีชุดข้อมูลของผู้ติดยา 400 คนซึ่งแต่ละคนระบุว่าพวกเขาเสพยา มีมากกว่า 10 ยาเสพติดและด้วยเหตุนี้จึงมีการรวมกันเป็นไปได้ที่มีขนาดใหญ่ ฉันคำนวณส่วนใหญ่ของยาเสพติดที่พวกเขาใช้เป็นตัวแปรไบนารี (เช่นเฮโรอีนคือ 1 หากผู้เสพติดเฮโรอีนเสพติด 0) ฉันต้องการค้นหาชุดยายอดนิยมหรือยาสามัญ 2 หรือ 3 ตัว มีวิธีการทางสถิติที่ฉันสามารถใช้ได้หรือไม่?

2
จะทดสอบสถิติได้อย่างไรว่าเครือข่าย (กราฟ) ของฉันเป็นเครือข่าย "โลกใบเล็ก" หรือไม่?
เครือข่ายขนาดเล็กของโลกคือประเภทของกราฟทางคณิตศาสตร์ในการที่โหนดส่วนใหญ่จะไม่เพื่อนบ้านของอีกคนหนึ่ง แต่โหนดส่วนใหญ่สามารถเข้าถึงได้จากทุกอื่น ๆ โดยจำนวนเล็ก ๆ ของฮอปส์หรือขั้นตอน โดยเฉพาะเครือข่ายโลกขนาดเล็กถูกกำหนดให้เป็นเครือข่ายที่ระยะทางปกติ L ระหว่างสองโหนดสุ่มเลือก (จำนวนขั้นตอนที่จำเป็น) เติบโตตามสัดส่วนลอการิทึมของจำนวนโหนด N ในเครือข่ายนั่นคือ L≈log(N)L≈log⁡(N) L \approx \log(N) ความสัมพันธ์ระหว่าง L และ N นี้เป็น "กฎนิ้วหัวแม่มือ" ฉันกำลังมองหากราฟระดับโลกขนาดเล็กที่เป็นมืออาชีพมากขึ้นสำหรับการวิจัย ฉันจะทดสอบได้อย่างไรว่ากราฟของฉันเป็นกราฟขนาดเล็กหรือไม่ การทดลองในโลกใบเล็กประกอบด้วยการทดลองหลายอย่างที่ดำเนินการโดย Stanley Milgram และนักวิจัยอื่น ๆ ที่ตรวจสอบความยาวเส้นทางโดยเฉลี่ยสำหรับเครือข่ายสังคมออนไลน์ของผู้คนในสหรัฐอเมริกา การวิจัยครั้งนี้มีความก้าวล้ำในการแนะนำว่าสังคมมนุษย์เป็นเครือข่ายขนาดเล็กระดับโลกที่มีความยาวเส้นทางสั้น การทดลองมักเกี่ยวข้องกับวลี "การแยกหกองศา" แม้ว่า Milgram จะไม่ใช้คำนี้ด้วยตนเอง ขอบคุณล่วงหน้า.

2
นอกเหนือจาก Durbin-Watson แล้วการทดสอบสมมติฐานใดบ้างที่สามารถสร้างผลลัพธ์ที่สรุปไม่ได้?
สถิติทดสอบ Durbin-Watsonสามารถนอนในภูมิภาคที่สรุปไม่ได้ที่มันเป็นไปไม่ได้อย่างใดอย่างหนึ่งที่จะปฏิเสธหรือล้มเหลวที่จะปฏิเสธสมมติฐาน (ในกรณีนี้ศูนย์อัต) การทดสอบทางสถิติอื่นใดที่สามารถให้ผลลัพธ์ที่ "สรุปไม่ได้"? มีคำอธิบายทั่วไป (การโบกมือเป็นไร) เพราะเหตุใดชุดทดสอบนี้จึงไม่สามารถทำการตัดสินใจไบนารี "ปฏิเสธ" / "ไม่สามารถปฏิเสธ" ได้? มันจะเป็นโบนัสถ้ามีใครสามารถพูดถึงผลกระทบของการตัดสินใจเชิงทฤษฎีซึ่งเป็นส่วนหนึ่งของคำตอบของพวกเขาในแบบสอบถามหลัง - การมีหมวดหมู่เพิ่มเติมของข้อสรุป (ใน) หมายความว่าเราต้องพิจารณาค่าใช้จ่ายของ Type I และ Type II ข้อผิดพลาดในวิธีที่ซับซ้อนมากขึ้น?

1
วิธีทดสอบว่า“ สถานะก่อนหน้า” มีอิทธิพลต่อ“ สถานะต่อมา” ใน R หรือไม่
ลองนึกภาพสถานการณ์: เรามีบันทึกทางประวัติศาสตร์ (20 ปี) จากเหมืองสามแห่ง การมีเงินอยู่เพิ่มความน่าจะเป็นในการค้นหาทองคำในปีหน้าหรือไม่? วิธีทดสอบคำถามดังกล่าว นี่คือข้อมูลตัวอย่าง: mine_A <- c("silver","rock","gold","gold","gold","gold","gold", "rock","rock","rock","rock","silver","rock","rock", "rock","rock","rock","silver","rock","rock") mine_B <- c("rock","rock","rock","rock","silver","rock","rock", "silver","gold","gold","gold","gold","gold","rock", "silver","rock","rock","rock","rock","rock") mine_C <- c("rock","rock","silver","rock","rock","rock","rock", "rock","silver","rock","rock","rock","rock","silver", "gold","gold","gold","gold","gold","gold") time <- seq(from = 1, to = 20, by = 1)

1
เปรียบเทียบแบบผสมเอฟเฟกต์และเอฟเฟกต์คงที่ (การทดสอบความสำคัญของเอฟเฟกต์แบบสุ่ม)
ให้สามตัวแปรyและxซึ่งเป็นบวกอย่างต่อเนื่องและzซึ่งเป็นเด็ดขาดฉันมีสองรูปแบบผู้สมัครที่กำหนดโดย: fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) ) และ fit.fe <- lm( y ~ 1 + x ) ฉันหวังว่าจะเปรียบเทียบแบบจำลองเหล่านี้เพื่อพิจารณาว่าแบบจำลองใดเหมาะสมกว่า ดูเหมือนว่าผมว่าในความรู้สึกบางอย่างฝังอยู่ในfit.fe fit.meโดยทั่วไปเมื่อสถานการณ์ทั่วไปนี้มีการทดสอบแบบไคสแควร์สามารถทำได้ ในRเราสามารถทำการทดสอบนี้ด้วยคำสั่งดังต่อไปนี้ anova(fit.fe,fit.me) เมื่อทั้งสองรุ่นมีเอฟเฟกต์แบบสุ่ม (สร้างโดยlmerจากlme4แพ็คเกจ) anova()คำสั่งทำงานได้ดี เนื่องจากโดยทั่วไปแล้วจะแนะนำให้ทดสอบสถิติ Chi-Square ผ่านการจำลองอย่างไรก็ตามเรายังสามารถใช้สถิติในขั้นตอนการจำลองได้ เมื่อทั้งสองรุ่นมีเอฟเฟกต์ถาวรเท่านั้นวิธีการนี้ --- และanova()คำสั่งที่เกี่ยวข้อง--- ทำงานได้ดี แต่เมื่อรุ่นหนึ่งที่มีผลกระทบสุ่มและรูปแบบที่ลดลงมีเพียงผลกระทบคงที่ในขณะที่สถานการณ์ข้างต้นanova()คำสั่งไม่ทำงาน โดยเฉพาะอย่างยิ่งฉันได้รับข้อผิดพลาดต่อไปนี้: > anova(fit.fe, fit.me) Error: $ …

3
การตัดสินใจระหว่างตัวแบบการถดถอยเชิงเส้นหรือตัวแบบการถดถอยเชิงเส้น
เราควรเลือกระหว่างการใช้โมเดลการถดถอยเชิงเส้นหรือแบบจำลองการถดถอยเชิงเส้นอย่างไร เป้าหมายของฉันคือการทำนาย Y ในกรณีของชุดข้อมูลและy ที่เรียบง่ายฉันสามารถตัดสินใจได้อย่างง่ายดายว่ารูปแบบการถดถอยควรใช้โดยการพล็อตพล็อตกระจายxxxyyy ในกรณีที่มีหลายตัวแปรเช่นและY ฉันจะตัดสินใจได้อย่างไรว่าจะใช้รูปแบบการถดถอยแบบใด นั่นคือฉันจะตัดสินใจเกี่ยวกับการใช้โมเดลเชิงเส้นอย่างง่ายหรือแบบจำลองเชิงเส้นแบบไม่ได้เช่น quadric, cubic เป็นต้นx1,x2,...xnx1,x2,...xnx_1,x_2,...x_nyyy มีเทคนิคหรือวิธีการทางสถิติหรือแปลงกราฟิกเพื่ออนุมานและตัดสินใจว่าจะใช้รูปแบบการถดถอยหรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.