การทดสอบการเปลี่ยนรูปเป็นการเปรียบเทียบตัวอย่างเดี่ยวกับค่าเฉลี่ย


10

เมื่อผู้คนทำการทดสอบการเปลี่ยนรูปเพื่อเปรียบเทียบตัวอย่างเดียวกับค่าเฉลี่ย (เช่นคุณอาจทำกับการทดสอบการเปลี่ยนรูป) วิธีการจัดการค่าเฉลี่ยเป็นอย่างไร ฉันได้เห็นการใช้งานที่ใช้ค่าเฉลี่ยและตัวอย่างสำหรับการทดสอบการเปลี่ยนรูป แต่ก็ไม่มีความชัดเจนในสิ่งที่พวกเขากำลังทำจริงภายใต้ประทุน มีวิธีที่มีความหมายในการทำแบบทดสอบการเปลี่ยนรูป (เช่น t-test) สำหรับตัวอย่างหนึ่งกับค่าเฉลี่ยที่สมมติหรือไม่? หรือมิฉะนั้นพวกเขาเพียงแค่เริ่มต้นการทดสอบที่ไม่ใช่การเปลี่ยนแปลงภายใต้ประทุน? (เช่นแม้จะเรียกใช้ฟังก์ชันการเรียงสับเปลี่ยนหรือตั้งค่าสถานะทดสอบการเปลี่ยนรูปแบบ แต่การเริ่มต้นเป็นมาตรฐาน t-test หรือฟังก์ชั่นที่คล้ายกัน)

ในการทดสอบการเปลี่ยนรูปสองตัวอย่างมาตรฐานหนึ่งกลุ่มจะมีสองกลุ่มและสุ่มการกำหนดป้ายกำกับ อย่างไรก็ตามสิ่งนี้จัดการได้อย่างไรเมื่อ "กลุ่ม" หนึ่งมีค่าเฉลี่ยที่สันนิษฐาน เห็นได้ชัดว่าค่าเฉลี่ยที่สันนิษฐานนั้นไม่มีขนาดตัวอย่างในตัวมันเอง ดังนั้นวิธีทั่วไปในการทำงานค่าเฉลี่ยในรูปแบบการเปลี่ยนแปลงคืออะไร? ตัวอย่าง "หมายถึง" ถือว่าเป็นจุดเดียวหรือไม่? กลุ่มตัวอย่างมีขนาดเท่ากันหรือไม่ ตัวอย่างขนาดไม่ จำกัด ?

เนื่องจากค่าเฉลี่ยที่สันนิษฐานไว้คือสมมุติว่า - ฉันบอกว่าในทางเทคนิคจะมีการสนับสนุนที่ไม่มีที่สิ้นสุดหรือการสนับสนุนใดก็ตามที่คุณต้องการสมมติ อย่างไรก็ตามสิ่งเหล่านี้ไม่เป็นประโยชน์อย่างมากสำหรับการคำนวณจริง ตัวอย่างขนาดเท่ากันที่มีค่าทั้งหมดเท่ากับค่าเฉลี่ยดูเหมือนจะเป็นสิ่งที่ทำในบางครั้งด้วยการทดสอบบางอย่าง (เช่นคุณเพียงแค่เติมอีกครึ่งหนึ่งของคู่ด้วยตำแหน่งที่สมมติ) มันสมเหตุสมผลดีเนื่องจากเป็นตัวอย่างที่มีความยาวเท่ากันคุณจะเห็นว่าค่าเฉลี่ยที่คุณสันนิษฐานนั้นถูกต้องโดยไม่มีความแปรปรวนหรือไม่

ดังนั้นคำถามของฉันคือ: ในทางปฏิบัติจริง ๆ แล้วผู้คนเลียนแบบการสุ่มเปลี่ยนรูปแบบป้ายกำกับการทดสอบเมื่อชุดที่สองเป็นค่าเฉลี่ย ถ้าเป็นเช่นนั้นผู้คนจะจัดการกับการสุ่มป้ายกำกับเมื่อพวกเขาทำเช่นนี้ได้อย่างไร


6
การทดสอบการเปลี่ยนรูปของค่าเฉลี่ยของสมมติฐานที่ตั้งไว้นั้นไม่แตกต่างจากการลบที่ค่าเฉลี่ยที่ตั้งสมมติฐานจากข้อมูลและการทดสอบเทียบกับค่าเฉลี่ยของศูนย์ การทดสอบแบบคู่อธิบายไว้ที่นี่ ; มันทำให้สมมติฐานที่ว่าภายใต้โมฆะคู่มีการกระจายตัวเดียวกันซึ่งหมายถึงความแตกต่างที่การทดสอบหนึ่งตัวอย่างที่ตามมาจะถือว่าเป็นสมมาตร บนพื้นฐานนั้นสัญญาณจะถูกพลิกแบบสุ่มในแต่ละความแตกต่าง ... (ctd)
Glen_b

1
(ctd) ... (ซึ่งสำหรับการทดสอบแบบจับคู่นั้นเทียบเท่ากับการพลิกฉลากกลุ่ม) นั่นคือการทดสอบการสุ่ม - สำหรับการทดสอบการเปลี่ยนรูปแบบเต็มคุณจะต้องทำทั้งรวมกันที่เป็นไปได้ของการพลิกสัญญาณ หากคุณไม่สามารถคาดเดาความสมมาตรได้มันเป็นการยากที่จะเห็นว่าคุณจะเปลี่ยนแปลงอะไร - แต่คุณควรจะทำการทดสอบ bootstrap ได้ 2n
Glen_b -Reinstate Monica

นั่นทำให้รู้สึก แต่ฉันกำลังคิดเล็กน้อยจากการใช้งานการคำนวณที่ผู้คนทำ หากคุณสามารถแปลงเป็นการทดสอบสัญญาณผู้คนสนใจที่จะคำนวณการเรียงสับเปลี่ยนหรือไม่? สำหรับลำดับความยาวใด ๆ N การเปลี่ยนลำดับแบบเต็มของการโยนสัญลักษณ์จะเหมือนกันหรือไม่? ดังนั้นฉันคิดว่าภายใต้ประทุนผู้คนอาจเข้ามาทดสอบช่องทวินามแทนการสร้างพีชคณิตด้วยตนเอง ฉันส่วนใหญ่สงสัยว่า / เมื่อมีประโยชน์ในการ relabeling & permuting เมื่อเทียบกับการใช้การทดสอบมาตรฐานในกรณีตัวอย่างเดียวกับค่าเฉลี่ย
ชื่อ

ฉันไม่ได้แนะนำให้แปลงเป็นการทดสอบเครื่องหมายเลย ภายใต้โครงการที่ฉันกำลัง disucssing สัญญาณจะเปลี่ยนแปลง แต่ค่าสัมบูรณ์ของข้อมูลต้นฉบับจะถูกเก็บไว้; permutedเป็นที่เป็นทั้งหรือ-1นั่นคือถ้าเป็น 11.43 ในการทดสอบตัวอย่างหนึ่งเทียบกับค่าเฉลี่ยของศูนย์ที่เปลี่ยนแปลงทั้งหมดจะเท่ากับ -11.43 หรือ +11.43 หากคุณจัดอันดับข้อมูลสัมบูรณ์เป็นอันดับแรกคุณจะต้องลงเอยด้วยการทดสอบอันดับของ Wilcoxon ที่ลงลายมือชื่อไว้ดังนั้นมันจึงเหมือนกับเวอร์ชั่นที่ไม่มีการจัดอันดับ kthxisi[k]|xi|s+11x10x10
Glen_b -Reinstate Monica

คำตอบ:


6

ขยายความคิดเห็นของGlen_bให้เป็นคำตอบ

การทดสอบการเปลี่ยนตัวอย่างหนึ่งตัวอย่างโดยประมาณสำหรับค่าเฉลี่ยของตัวอย่างเปรียบเทียบกับสมมติฐานว่างของค่าเฉลี่ยศูนย์จะดำเนินการโดยกำหนดสัญญาณสุ่มให้กับข้อมูลในตัวอย่าง สมมติฐานว่างที่ไม่เป็นศูนย์สามารถทดสอบได้โดยการลบค่าเฉลี่ยที่ต้องการจากข้อมูล

นี้เป็นเรื่องง่ายที่จะเห็นในแหล่งที่มาของฟังก์ชั่น R ที่ในแพคเกจonetPermutation DAAGนี่คือข้อความที่ตัดตอนมาของรหัสที่เกี่ยวข้องพร้อมกับความคิดเห็นที่ฉันได้เพิ่ม:

function (x, nsim) {

  ## Initialize and pre-allocate

  n <- length(x)
  dbar <- mean(x)
  absx <- abs(x)  # there's actually a bug in the code; below you'll see that the function ends up re-computing abs(x) instead of using this
  z <- array(, nsim)


  ## Run the simulation    

  for (i in 1:nsim) {                             # Do nsim times:
      mn <- sample(c(-1, 1), n, replace = TRUE)   #  1. take n random draws from {-1, 1}, where n is the length of the data to be tested
      xbardash <- mean(mn * abs(x))               #  2. assign the signs to the data and put them in a temporary variable
      z[i] <- xbardash                            #  3. save the new data in an array
  }


  ## Return the p value
  # p = the fraction of fake data that is:
  #      larger than |sample mean of x|, or
  #    smaller than -|sample mean of x|

  (sum(z >= abs(dbar)) + sum(z <= -abs(dbar)))/nsim
}

ฟังก์ชั่นของabsในรหัสข้างต้นคืออะไร? จะไม่พลิกฉลากจะเท่าเทียมกันเป็นแบบสุ่มโดยไม่abs?
Matthew Brett
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.