ต้องจ่ายเท่าไหร่ ปัญหาในทางปฏิบัติ


66

นี่ไม่ใช่คำถามทำงานที่บ้าน แต่ปัญหาที่แท้จริงของ บริษัท ของเรา

เมื่อเร็ว ๆ นี้ (2 วันที่ผ่านมา) เราสั่งให้ผลิตฉลากผลิตภัณฑ์ 10,000 รายการให้กับตัวแทนจำหน่าย ตัวแทนจำหน่ายเป็นบุคคลที่เป็นอิสระ เขาได้รับฉลากที่ผลิตจากภายนอกและ บริษัท ชำระเงินให้กับตัวแทนจำหน่าย ป้ายกำกับแต่ละรายการมีราคาเท่ากับ $ 1 ถึง บริษัท

เมื่อวานนี้ดีลเลอร์มาพร้อมกับฉลาก แต่มีการรวมฉลากในแพ็คเก็ตละ 100 ป้าย ด้วยวิธีนี้มี 100 แพ็กเก็ตและแต่ละแพ็คเก็ตมี 100 ป้ายดังนั้นรวม 10,000 ป้าย ก่อนที่จะชำระเงินให้กับตัวแทนจำหน่ายของ $ 10,000 เราตัดสินใจที่จะนับแพ็คเก็ตน้อยเพื่อให้แน่ใจว่าแต่ละแพ็คเก็ตมี 100 ป้าย เมื่อเรานับฉลากเราพบว่าแพ็คเก็ตสั้น 100 ป้าย (เราพบ 97 ป้าย) เพื่อให้แน่ใจว่านี่ไม่ใช่โดยบังเอิญ แต่ได้ทำไปโดยเจตนาเราได้นับ 5 แพ็กเก็ตเพิ่มเติมและพบจำนวนป้ายกำกับต่อไปนี้ในแต่ละแพ็คเก็ต (รวมถึงแพ็กเก็ตแรก):

Packet Number    Number of labels
1                97 
2                98  
3                96
4                100
5                95 
6                97  

เป็นไปไม่ได้ที่จะนับแต่ละแพ็คเก็ตดังนั้นเราจึงตัดสินใจชำระเงินโดยเฉลี่ย ดังนั้นจำนวนป้ายกำกับโดยเฉลี่ยในหกแพ็คเก็ตคือ 97.166 ดังนั้นการชำระเงินทั้งหมดจึงเท่ากับ $ 9716

ฉันแค่อยากรู้ว่านักสถิติต้องจัดการกับปัญหาประเภทนี้อย่างไร
ต่อไปฉันต้องการทราบว่าเราควรจ่ายเท่าไรเพื่อรับความมั่นใจ 95% ว่าเราไม่ได้จ่ายเงินมากกว่าจำนวนป้ายจริงทั้งหมด

ข้อมูลเพิ่มเติม:

P (แพ็คเก็ตใด ๆ ที่มีฉลากมากกว่า 100 รายการ) = 0
P (แพ็คเก็ตใด ๆ ที่มีฉลากน้อยกว่า 90) = 0 {ฉลากน้อยกว่า 90 จะสามารถตรวจพบได้ง่ายในขณะที่นับจำนวนแพ็คเก็ตเพราะแพ็คเก็ตจะมีน้ำหนักน้อยกว่า}


แก้ไข: ดีลเลอร์ปฏิเสธการทุจริตต่อหน้าที่เพียงอย่างเดียว เราพบว่าตัวแทนจำหน่ายเหล่านี้ทำงานในค่าคอมมิชชันเฉพาะที่พวกเขาได้รับจากผู้ผลิตในสิ่งที่ บริษัท จ่ายให้เมื่อเราสื่อสารกับผู้ผลิตโดยตรงเราพบว่าไม่ใช่ผู้ผลิตหรือผู้จำหน่ายผิด ผู้ผลิตกล่าวว่า“ ฉลากสั้นเพราะแผ่นไม่ได้มาตรฐานขนาดและจำนวนใดก็ตามที่ถูกตัดจากแผ่นงานเดียวที่พวกเขานำมารวมเข้าด้วยกันในแพ็คเก็ต”

เพิ่มเติมเราได้รับการตรวจสอบยืนยันครั้งแรกของเราที่ให้ไว้ในข้อมูลเพิ่มเติมเนื่องจากผู้ผลิตยอมรับว่าจากการเพิ่มขนาดขอบของแผ่นเป็นไปไม่ได้ที่จะตัดฉลากเพิ่มเติมจากการลดขนาดขอบของแผ่นที่ไม่สามารถตัดได้ 100 ป้ายที่มีขนาดเท่ากันทั้งหมด


7
+1 (1) คุณจะยืนยันการยืนยันครั้งแรกในส่วน "ข้อมูลเพิ่มเติม" ได้อย่างไร (2) คุณชั่งน้ำหนักแพ็คเก็ตได้แม่นยำแค่ไหน?
whuber

15
อังกฤษและไอแซกนิวตันเผชิญปัญหาเดียวกันเมื่อ 300 ปีที่แล้ว (เดิมพันค่อนข้างมากขึ้นเพราะ "ป้าย" ในคำถามถูกเหรียญ.) ดังนั้นคุณอาจจะสนุกกับการอ่านบัญชีสตีเฟ่น Stigler ของการทดลองของกล่องบรรจุขนมปังของพระผู้เป็นเจ้าที่stat.wisc.edu/sites/default/files/TR442_0.pdf
whuber

7
@Neraera หากน้ำหนักของสินค้าทั้งหมดสอดคล้องกันทำไมไม่เพียงแค่ชั่งน้ำหนักการจัดส่งทั้งหมด?
Reinstate Monica

9
เสนอที่จะจ่าย $ 9000 และรอให้พวกเขาพูดว่า "แต่เราแค่ทำให้คุณเตี้ย 600 ไม่ใช่ 1,000"
Dean MacGregor

5
นอกเหนือจากคำถามทางสถิติที่ยอดเยี่ยม +1 ฉันต้องการแบ่งปันคำแนะนำโดยตรงมากขึ้นจากธุรกิจการพิมพ์: เครื่องพิมพ์มืออาชีพที่เหมาะสมทั้งหมดมีนโยบายที่เกินกว่า / ต่ำกว่าเช่นนี้เพราะเครื่องพิมพ์ส่วนใหญ่ไม่มีการนับที่แน่นอน สิ่งใดก็ตามที่ไม่ได้ใช้ "หมายเลข" (หมายเลขซีเรียลแต่ละหมายเลข) แต่พวกเขาควรมีจำนวนที่ยอดเยี่ยมของสิ่งที่พวกเขาให้คุณและถ้า shorted ส่วนลดคุณถ้าน้อยกว่า (5% พูด) การเรียกเก็บเงินเต็มราคาสำหรับการใช้งานภายใต้ที่รู้จักนั้นไม่ใช่นโยบายมาตรฐาน
BrianH

คำตอบ:


20

ฉันจะสนใจข้อเสนอแนะในย่อหน้าที่เริ่มต้น "เมื่อไตร่ตรอง ... " เนื่องจากส่วนหนึ่งของแบบจำลองทำให้ฉันอยู่ในเวลากลางคืน

แบบจำลองเบย์

คำถามที่แก้ไขแล้วทำให้ฉันคิดว่าเราสามารถพัฒนาแบบจำลองได้อย่างชัดเจนโดยไม่ต้องใช้การจำลอง การจำลองแนะนำความแปรปรวนเพิ่มเติมเนื่องจากการสุ่มตัวอย่างโดยธรรมชาติของการสุ่มตัวอย่าง แม้ว่าคำตอบของนัก Sophologists นั้นยอดเยี่ยม

สมมติฐาน : จำนวนป้ายต่อซองที่น้อยที่สุดคือ 90 และมากที่สุดคือ 100

ดังนั้นจำนวนป้ายที่เล็กที่สุดที่เป็นไปได้คือ 9000 + 7 + 8 + 6 + 10 + 5 + 7 = 9043 (ตามที่กำหนดโดยข้อมูลของ OP), 9000 เนื่องจากขอบเขตล่างของเราและฉลากเพิ่มเติมที่มาจากข้อมูลที่สังเกตได้

แสดงว่าจำนวนฉลากในซองจดหมายฉันแสดงว่าจำนวนป้ายเกินกว่า 90 คือดังนั้น\} รูปแบบการแจกแจงแบบทวินามจำนวนรวมของความสำเร็จ (นี่คือความสำเร็จคือการปรากฏตัวของฉลากในซองจดหมาย) ในการทดลองเมื่อการทดลองเป็นอิสระกับความน่าจะเป็นความสำเร็จคงที่ดังนั้นใช้ค่าเราใช้ซึ่งให้ผลลัพธ์ที่เป็นไปได้ 11 อย่างที่แตกต่างกัน ฉันคิดว่าเนื่องจากขนาดแผ่นไม่สม่ำเสมอบางแผ่นมีพื้นที่สำหรับYiiXiX=Y90X{0,1,2,...,10}npX0,1,2,3,...,n.n=10Xป้ายชื่อเพิ่มเติมในส่วนที่เกินจาก 90 และที่นี้ "พื้นที่เพิ่มเติม" สำหรับแต่ละป้ายในส่วนที่เกินจาก 90 เกิดขึ้นกับความน่าจะเป็นอิสระพีดังนั้นpXiBinomial(10,p).

(จากการไตร่ตรองความเป็นอิสระ / รูปแบบทวินามอาจเป็นข้อสันนิษฐานที่แปลกเนื่องจากมันจะแก้ไของค์ประกอบของแผ่นของเครื่องพิมพ์ให้เป็นแบบ unimodal ได้อย่างมีประสิทธิภาพและข้อมูลสามารถเปลี่ยนตำแหน่งของโหมดได้เท่านั้น แต่รูปแบบจะไม่ยอมรับ การกระจายแบบ multimodal ตัวอย่างเช่นภายใต้รุ่นอื่นเป็นไปได้ว่าเครื่องพิมพ์เท่านั้นมีแผ่นขนาด 97, 98, 96, 100 และ 95: สิ่งนี้เป็นไปตามข้อ จำกัด และข้อมูลที่ระบุไว้ทั้งหมดไม่ได้ยกเว้นความเป็นไปได้นี้ อาจเหมาะสมกว่าที่จะพิจารณาว่าขนาดกระดาษแต่ละแผ่นเป็นประเภทของตัวเองและจากนั้นใส่โมเดล Dirichlet-multinomial เข้ากับข้อมูล ฉันไม่ได้ทำที่นี่เพราะข้อมูลหายากดังนั้นความน่าจะเป็นหลังของแต่ละหมวดหมู่ 11 หมวดหมู่จะได้รับอิทธิพลอย่างมากจากก่อนหน้านี้ ในอีกทางหนึ่งโดยการปรับโมเดลให้เรียบง่ายขึ้นเราก็จะทำการอนุมานชนิดของการอนุมานที่เราสามารถทำได้)

แต่ละซองเป็นสำนึกของ IID Xผลรวมของการทดลองแบบทวินามที่มีโอกาสประสบความสำเร็จเท่ากันคือเป็นแบบทวินามดังนั้น(นี่คือทฤษฎีบท - เพื่อตรวจสอบใช้ทฤษฎีบทเอกลักษณ์ของ MGF)iXpiXiBinomial(60,p).

ฉันชอบคิดเกี่ยวกับปัญหาเหล่านี้ในโหมด Bayesian เพราะคุณสามารถสร้างความน่าจะเป็นโดยตรงเกี่ยวกับปริมาณความสนใจด้านหลัง ตัวอย่างทั่วไปสำหรับการทดลองแบบทวินามที่ไม่ทราบค่าคือการแจกแจงแบบเบตาซึ่งมีความยืดหยุ่นสูง (แตกต่างกันระหว่าง 0 และ 1 สามารถสมมาตรหรือไม่สมมาตรในทิศทางใดทิศทางหนึ่งสม่ำเสมอหรือหนึ่งในสองมวลของไดแรค มันเป็นเครื่องมือที่น่าทึ่ง!) ในกรณีที่ไม่มีข้อมูลที่ดูเหมือนว่าเหตุผลที่จะสมมติน่าจะสม่ำเสมอทั่วหน้านั่นคือเราอาจคาดหวังที่จะเห็นแผ่นรองรับ 90 ฉลากได้บ่อยเท่าที่ 91 เป็นบ่อยเท่าที่ 92, ... , บ่อยที่สุดเท่าที่ 100 ดังนั้นก่อนหน้านี้ของเราคือpppBeta(1,1).หากคุณไม่คิดว่ารุ่นเบต้าก่อนหน้านี้มีความสมเหตุสมผลชุดก่อนหน้านี้สามารถแทนที่ด้วยรุ่นเบต้าก่อนหน้าได้และคณิตศาสตร์จะไม่เพิ่มความยากลำบากแม้แต่น้อย!

การกระจายด้านหลังบนคือโดยคุณสมบัติการของรุ่นนี้ อย่างไรก็ตามนี่เป็นเพียงขั้นตอนกลางเนื่องจากเราไม่สนใจเกี่ยวกับเท่าที่เราใส่ใจเกี่ยวกับจำนวนป้ายกำกับทั้งหมด ในที่สุดคุณสมบัติของการผันคำกริยายังหมายความว่าการกระจายการทำนายหลังของแผ่นงานคือเบต้า - ทวินามด้วยพารามิเตอร์ของเบต้าหลัง "การทดลอง" มี reamining คือป้ายที่การแสดงตนของพวกเขาในการจัดส่งมีความไม่แน่นอนดังนั้นรูปแบบด้านหลังของเราบนฉลากที่เหลือคือppBeta(1+43,1+17)p940ZZBB(44,18,940).

ป้อนคำอธิบายรูปภาพที่นี่

เนื่องจากเรามีการแจกแจงแบบและรูปแบบค่าต่อป้าย (ผู้ขายตกลงกับหนึ่งดอลลาร์ต่อป้ายกำกับ) เราจึงสามารถอนุมานการกระจายความน่าจะเป็นมากกว่ามูลค่าของล็อตได้ แสดงมูลค่าเงินรวมของล็อต เรารู้ว่าเนื่องจากเพียงรูปแบบฉลากที่เราไม่แน่ใจ ดังนั้นการกระจายมากกว่าค่าที่จะได้รับจากDZDD=9043+ZZD

วิธีที่เหมาะสมในการพิจารณากำหนดราคาล็อตคืออะไร

เราสามารถพบว่าปริมาณที่ 0.025 และ 0.975 (ช่วง 95%) เป็น 553 และ 769 ตามลำดับ ดังนั้นช่วง 95% เมื่อ D เป็น9812] การชำระเงินของคุณอยู่ในช่วงเวลานั้น (การกระจายตัวของนั้นไม่สมมาตรกันดังนั้นนี่ไม่ใช่ช่วงกลาง 95% - อย่างไรก็ตามความไม่สมดุลนั้นไม่สำคัญอย่างไรก็ตามเมื่อฉันอธิบายรายละเอียดด้านล่างฉันไม่แน่ใจว่าช่วง 95% กลางนั้นถูกต้อง หนึ่งในการพิจารณา!)[9596,9812]D

ฉันไม่ทราบถึงฟังก์ชัน quantile สำหรับการแจกแจงแบบทวินามเบต้าใน R ดังนั้นฉันจึงเขียนของตัวเองโดยใช้การค้นหารูทของ R

qbetabinom.ab <- function(p, size, shape1, shape2){
    tmpFn <- function(x) pbetabinom.ab(x, size=size, shape1=shape1, shape2=shape2)-p
    q <- uniroot(f=tmpFn, interval=c(0,size))
    return(q$root)
}

วิธีคิดอีกอย่างคือการคิดถึงความคาดหวัง หากคุณทำขั้นตอนนี้ซ้ำหลายครั้งคุณต้องจ่ายต้นทุนโดยเฉลี่ยเท่าใด เราสามารถคำนวณความคาดหวังของโดยตรง รุ่นเบต้าทวินามมีความคาดหวังดังนั้นเกือบจะเท่ากับที่คุณจ่าย การสูญเสียที่คาดหวังของคุณในการจัดการเป็นเพียง 6 ดอลลาร์! ทั้งหมดบอกว่าทำได้ดีมาก!DE(D)=E(9043+Z)=E(Z)+9043.E(Z)=nαα+β=667.0968E(D)=9710.097,

แต่ฉันไม่แน่ใจว่าตัวเลขเหล่านี้อย่างใดอย่างหนึ่งที่เกี่ยวข้องมากที่สุด ท้ายที่สุดผู้ขายรายนี้พยายามหลอกคุณ! ถ้าฉันทำข้อตกลงนี้ฉันจะหยุดกังวลเกี่ยวกับการทำลายราคาหรือมูลค่าที่เป็นธรรมของล็อตและเริ่มต้นหาโอกาสที่ฉันจะจ่ายเงินมากเกินไป! ผู้ขายพยายามหลอกลวงฉันอย่างชัดเจนดังนั้นฉันจึงอยู่ภายใต้สิทธิ์ของฉันในการลดความสูญเสียให้น้อยที่สุดและไม่เกี่ยวข้องกับจุดคุ้มทุน ในการตั้งค่านี้ราคาสูงสุดที่ฉันจะเสนอคือ 9615 ดอลลาร์เพราะนี่คือควอไทล์ 5% ของด้านหลังบนนั่นคือมีความน่าจะเป็น 95% ที่ฉันได้รับน้อยDไป ผู้ขายไม่สามารถพิสูจน์ให้ฉันเห็นว่ามีฉลากทั้งหมดอยู่ดังนั้นฉันจะป้องกันความเสี่ยงของการเดิมพัน

(แน่นอนความจริงที่ว่าผู้ขายยอมรับข้อตกลงนั้นบอกเราว่าเขามีการสูญเสียที่ไม่จำเป็นจริง ๆ ... ฉันไม่ได้คิดวิธีที่จะใช้ข้อมูลนั้นเพื่อช่วยให้เรากำหนดได้อย่างแม่นยำว่าคุณถูกโกงมากน้อยเพียงใด เพราะเขายอมรับข้อเสนอคุณก็ยังทำได้ดีที่สุด )

เปรียบเทียบกับ bootstrap

เรามีข้อสังเกตเพียง 6 ข้อเท่านั้นที่จะทำงานร่วมกับ เหตุผลสำหรับ bootstrap นั้นเป็น asymptotic ดังนั้นลองมาดูกันว่าผลลัพธ์จะเป็นอย่างไรในตัวอย่างเล็ก ๆ ของเรา เนื้อเรื่องนี้แสดงความหนาแน่นของการจำลองการเสริมแรง ป้อนคำอธิบายรูปภาพที่นี่

รูปแบบ "เป็นหลุมเป็นบ่อ" เป็นสิ่งประดิษฐ์ของขนาดตัวอย่างเล็ก ๆ การรวมหรือแยกจุดใดจุดหนึ่งจะมีผลอย่างมากต่อค่าเฉลี่ยการสร้างลักษณะ "พวง" นี้ วิธีการแบบเบย์ทำให้กลุ่มเหล่านี้เรียบและในความคิดของฉันเป็นภาพเหมือนที่น่าเชื่อถือมากขึ้นว่าเกิดอะไรขึ้น เส้นแนวตั้งคือ quantile 5%


มันเป็นคำตอบที่ดี คุณให้ข้อมูลเชิงลึกใหม่โดยลงโทษความเสี่ยง ขอบคุณ
Neeraj

1
ฉันดีใจที่พบว่าการสูญเสียที่คาดหวังของคุณเป็นเพียง $ 6 :-) ขอบคุณอีกครั้งสำหรับคำถามที่ยอดเยี่ยม
Reinstate Monica

1
การแจกแจงทวินามเป็นการจำลองจำนวนความสำเร็จในการทดลองเมื่อการทดลองมีความเป็นอิสระกับความน่าจะเป็นที่จะประสบความสำเร็จคงที่ดังนั้นมันจึงใช้ค่าเราใช้ซึ่งให้ผลลัพธ์ที่เป็นไปได้ 11 อย่างที่แตกต่างกัน ผมคิดว่าเพราะขนาดแผ่นที่มีความผิดปกติของแผ่นบางเพียงมีห้องพักสำหรับฉลากเพิ่มเติมในส่วนที่เกินจาก 90 และที่นี้ "พื้นที่เพิ่มเติม" สำหรับแต่ละป้ายเกิดขึ้นกับความน่าจะเป็นพีnp0,1,2,3,....,n.n=10Xp
Reinstate Monica

1
รูปแบบ Poisson สามารถใช้ค่า... ดังนั้นมันจึงกำหนดความน่าจะเป็นเชิงบวกให้กับฉลากต่อแพ็คเก็ต ขณะนี้มีขนาดเล็กน่าจะเป็นของรายการภายใต้รูปแบบ Poisson ใด ๆ ที่เหมาะสมเพื่อให้ข้อมูลเหล่านี้ แต่ไม่มีใครใช้รูปแบบ Poisson เพราะมันไม่เคารพข้อ จำกัด10 101 , 102 , 103 , . . , 10 6 10 6 0 X 100,1,2,3,...101,102,103,...,1061060X10
Reinstate Monica

1
ขอให้เรายังคงอภิปรายนี้ในการแชท
Reinstate Monica

20

แก้ไข:โศกนาฏกรรม! สมมติฐานเริ่มต้นของฉันไม่ถูกต้อง! (หรือมีข้อสงสัยอย่างน้อย - คุณไว้วางใจสิ่งที่ผู้ขายจะบอกคุณยังปลายหมวกมอร์เทนเช่นเดียว?.) ซึ่งผมคิดว่าเป็นอีกหนึ่งแนะนำที่ดีในสถิติ แต่แนวทางแผ่นบางส่วนอยู่ในขณะนี้เพิ่มด้านล่าง ( เนื่องจากคนดูเหมือนจะชอบทั้งแผ่นและบางคนอาจจะยังคงพบว่ามันมีประโยชน์)

ก่อนอื่นปัญหาใหญ่ แต่ฉันต้องการทำให้ซับซ้อนขึ้นอีกเล็กน้อย

เพราะการที่ก่อนที่ผมจะทำให้ฉันทำให้มันเล็ก ๆ น้อย ๆ ที่เรียบง่ายและบอกว่า - วิธีการที่คุณกำลังใช้อยู่ในขณะนี้เป็นที่เหมาะสมได้อย่างสมบูรณ์แบบ มันราคาถูกมันทำให้รู้สึกง่าย ดังนั้นหากคุณต้องติดกับมันคุณไม่ควรรู้สึกแย่ เพียงให้แน่ใจว่าคุณเลือกกลุ่มของคุณแบบสุ่ม และถ้าคุณสามารถชั่งน้ำหนักทุกอย่างได้อย่างน่าเชื่อถือ (ปลายหมวกถึง whuber และ user777) คุณควรทำเช่นนั้น

เหตุผลที่ฉันต้องการทำให้ซับซ้อนกว่านี้เล็กน้อยคือคุณมีอยู่แล้ว - คุณไม่ได้บอกเราเกี่ยวกับภาวะแทรกซ้อนทั้งหมดซึ่งก็คือ - การนับต้องใช้เวลาและเวลาก็เป็นเงินเช่นกัน แต่วิธีการมาก ? บางทีมันอาจจะถูกกว่าที่จะนับทุกอย่าง!

ดังนั้นสิ่งที่คุณกำลังทำจริง ๆ คือการสร้างสมดุลเวลาที่ใช้ในการนับด้วยจำนวนเงินที่คุณประหยัด (ถ้าแน่นอนคุณเล่นเกมนี้เพียงครั้งเดียวครั้งต่อไปที่คุณมีสิ่งนี้เกิดขึ้นกับผู้ขายพวกเขาอาจติดอยู่และลองใช้เคล็ดลับใหม่ในทฤษฎีเกมนี่คือความแตกต่างระหว่างเกมนัดเดียวและซ้ำ เกม แต่สำหรับตอนนี้มาเสแสร้งผู้ขายจะทำในสิ่งเดียวกันเสมอ)

อีกสิ่งหนึ่งก่อนที่ฉันจะได้รับการประเมินว่า (และขอโทษที่เขียนมากและยังไม่ได้คำตอบ แต่ก็เป็นคำตอบที่ดีสำหรับนักสถิติที่จะทำอะไรพวกเขาจะใช้เวลาจำนวนมากเพื่อให้แน่ใจว่าพวกเขาเข้าใจทุกส่วนเล็ก ๆ ของปัญหา ก่อนที่พวกเขาจะพูดอะไรเกี่ยวกับเรื่องนี้ได้อย่างสะดวกสบาย) และสิ่งนั้นคือความเข้าใจที่ลึกซึ้งตามสิ่งต่อไปนี้:

(แก้ไข: หากพวกเขากำลังโกงจริง ๆ ... ) ผู้ขายของคุณไม่ประหยัดเงินโดยการลบฉลาก - พวกเขาประหยัดเงินโดยไม่พิมพ์แผ่น พวกเขาไม่สามารถขายป้ายกำกับของคุณให้คนอื่น (ฉันถือว่า) และบางทีฉันไม่รู้และไม่รู้ว่าคุณทำอะไรพวกเขาไม่สามารถพิมพ์สิ่งของของคุณได้ครึ่งแผ่นและอีกครึ่งแผ่นของคนอื่น กล่าวอีกนัยหนึ่งก่อนที่คุณจะเริ่มนับคุณสามารถสมมติว่าจำนวนป้ายกำกับทั้งหมดเป็นเช่น9000, 9100, ... 9900, or 10,000นั้น นั่นเป็นวิธีที่ฉันจะเข้าใกล้ตอนนี้

ทั้งแผ่นวิธี

เมื่อปัญหายุ่งยากเล็กน้อยเช่นนี้ (ไม่ต่อเนื่องและล้อมรอบ) นักสถิติจำนวนมากจะจำลองสิ่งที่อาจเกิดขึ้น นี่คือสิ่งที่ฉันจำลอง:

# The number of sheets they used
sheets <- sample(90:100, 1)
# The base counts for the stacks
stacks <- rep(90, 100)
# The remaining labels are distributed randomly over the stacks
for(i in 1:((sheets-90)*100)){
    bucket <- sample(which(stacks!=100),1)
    stacks[bucket] <- stacks[bucket] + 1
}

สิ่งนี้จะช่วยให้คุณสมมติว่าพวกเขาใช้ทั้งแผ่นงานและข้อสันนิษฐานของคุณนั้นถูกต้องเป็นการกระจายฉลากที่เป็นไปได้ (ในภาษาโปรแกรม R)

จากนั้นฉันก็ทำสิ่งนี้:

alpha = 0.05/2
for(i in 4:20){
    s <- replicate(1000, mean(sample(stacks, i)))
    print(round(quantile(s, probs=c(alpha, 1-alpha)), 3))
}

พบว่าใช้วิธี "bootstrap" ช่วงความมั่นใจโดยใช้ตัวอย่าง 4, 5, ... 20 พูดอีกอย่างคือโดยเฉลี่ยถ้าคุณต้องใช้ตัวอย่าง N ช่วงเวลาความมั่นใจของคุณจะใหญ่แค่ไหน ฉันใช้สิ่งนี้เพื่อหาช่วงเวลาที่เล็กพอที่จะตัดสินใจเลือกจำนวนแผ่นและนั่นคือคำตอบของฉัน

โดย "เล็กพอ" ฉันหมายถึงช่วงความมั่นใจ 95% ของฉันมีเพียงจำนวนเต็มเดียว - เช่นถ้าช่วงความมั่นใจของฉันมาจาก [93.1, 94.7] ดังนั้นฉันจะเลือก 94 เป็นจำนวนแผ่นที่ถูกต้องเพราะเรารู้ มันเป็นจำนวนเต็ม

ความยากลำบากอีกแม้ว่า - ความมั่นใจของคุณขึ้นอยู่กับความจริง หากคุณมี 90 แผ่นและทุกกองมี 90 ป้ายจากนั้นคุณมาบรรจบกันอย่างรวดเร็วจริงๆ เหมือนกันกับ 100 แผ่น ดังนั้นฉันดูที่ 95 แผ่นซึ่งมีความไม่แน่นอนมากที่สุดและพบว่ามีความมั่นใจ 95% คุณต้องใช้ตัวอย่างประมาณ 15 ตัวอย่างโดยเฉลี่ย สมมุติว่าโดยรวมคุณต้องการตัวอย่าง 15 อันเพราะคุณไม่เคยรู้ว่ามีอะไรเกิดขึ้นจริง

หลังจากที่คุณทราบจำนวนตัวอย่างที่คุณต้องการคุณจะรู้ว่าการประหยัดที่คาดหวังของคุณคือ:

100Nmissing15c

c50015

แต่คุณควรคิดเงินกับคนที่ทำให้คุณทำงานทั้งหมดนี้ด้วย!

(แก้ไข: เพิ่ม!) แนวทางแผ่นบางส่วน

เอาล่ะสมมติว่าสิ่งที่ผู้ผลิตพูดนั้นเป็นจริงและไม่ใช่เจตนา - มีเพียงไม่กี่ป้ายที่หายไปในแผ่นงานทุกแผ่น คุณยังต้องการทราบเกี่ยวกับจำนวนป้ายกำกับโดยรวมหรือไม่

ปัญหานี้แตกต่างกันเนื่องจากคุณไม่มีการตัดสินใจที่ดีที่คุณสามารถทำได้อีกต่อไป - นั่นเป็นข้อได้เปรียบของสมมติฐานทั้งหมด ก่อนหน้านี้มีเพียง 11 คำตอบที่เป็นไปได้ - ตอนนี้มี 1100 และได้รับช่วงความมั่นใจ 95% จากจำนวนป้ายที่มีแนวโน้มว่าจะต้องใช้ตัวอย่างมากเกินกว่าที่คุณต้องการ ลองดูว่าเราสามารถคิดเกี่ยวกับสิ่งนี้ได้หรือไม่

เพราะนี่เป็นเรื่องเกี่ยวกับการตัดสินใจของคุณเรายังขาดพารามิเตอร์บางประการ - คุณยินดีที่จะเสียเงินเท่าไหร่ในการตกลงครั้งเดียวและใช้เงินเท่าไรในการนับสแต็กหนึ่ง แต่ให้ฉันตั้งค่าสิ่งที่คุณสามารถทำได้กับตัวเลขเหล่านั้น

จำลองอีกครั้ง (แม้ว่าอุปกรณ์ประกอบฉากถึงผู้ใช้ 777 หากคุณสามารถทำได้โดยไม่ต้อง!) มันเป็นข้อมูลที่จะดูขนาดของช่วงเวลาเมื่อใช้ตัวอย่างจำนวนที่แตกต่างกัน สามารถทำได้เช่นนี้

stacks <- 90 + round(10*runif(100))
q <- array(dim=c(17,2))
for(i in 4:20){
    s <- replicate(1000, mean(sample(stacks, i)))
    q[i-3,] <- quantile(s, probs=c(.025, .975))
}
plot(q[,1], ylim=c(90,100))
points(q[,2])

ซึ่งถือว่า (ขณะนี้) ที่แต่ละสแต็กมีจำนวนป้ายผนึกแบบสุ่มระหว่าง 90 ถึง 100 และให้:

ขอบเขตของช่วงความเชื่อมั่นตามจำนวนตัวอย่าง

แน่นอนถ้าสิ่งต่าง ๆ เหมือนจริงพวกเขาถูกจำลองค่าเฉลี่ยที่แท้จริงจะอยู่ที่ประมาณ 95 ตัวอย่างต่อสแต็คซึ่งต่ำกว่าความจริงที่ปรากฏ - นี่คืออาร์กิวเมนต์หนึ่งอันที่จริงแล้วสำหรับวิธีการแบบเบส์ แต่มันให้ความรู้สึกที่เป็นประโยชน์เกี่ยวกับว่าคุณมีความมั่นใจมากขึ้นเพียงใดเกี่ยวกับคำตอบของคุณในขณะที่คุณสุ่มตัวอย่างต่อไป - และตอนนี้คุณสามารถแลกเปลี่ยนต้นทุนการสุ่มตัวอย่างกับข้อตกลงใด ๆ

ซึ่งตอนนี้ฉันรู้แล้วเราทุกคนต่างก็อยากรู้อยากเห็น


6
+1 การวิเคราะห์นี้ตอบคำถามโดยตรงและอย่างสร้างสรรค์: นักสถิติ (ดี) คิดอย่างไรกับปัญหา การมุ่งเน้นไปที่การนับแผ่นเป็นข้อมูลเชิงลึกที่มีค่า
whuber

1
แนวทางการประหยัดต้นทุนเป็นแนวคิดที่ยอดเยี่ยม ถ้าอย่างนั้นฉันก็บอกได้ว่ากลุ่มคนที่มีกำลังสมองที่ทุ่มเทให้กับปัญหานี้มีจำนวนมากกว่าเงินออม $ 284 จาก n = 6 ตัวอย่างที่ Neeraj ใช้ :)
RobertF

1
คำตอบที่ดี ในขณะที่คุณกำลังเขียนมันเมื่อเครื่องพิมพ์หยิบสแต็คเต็มรูปแบบเขาเพิ่งวางฉลากเสริมลงไปที่พื้นซึ่งอาจสมเหตุสมผล แต่ถ้าคุณต้องการมี9000,9100...10000ป้ายกำกับทั้งหมดในตอนท้ายคุณสามารถแทนที่ของคุณถ้าตรรกะด้วย bucket <- sample(which(stacks!=100),1)แล้วเพิ่มสแต็กเสมอ
อดัมซี

1
อาเพิ่งสังเกตเห็นว่าตัวเอง! ขอบคุณสำหรับการจับ ความผิดพลาดอย่างแน่นอน
one_observation

1
คุณคำนวณช่วงความมั่นใจอย่างไร ใช้ bootstrap หรือไม่
RobertF

3

นี่เป็นตัวอย่างที่ค่อนข้าง จำกัด (ตัวอย่างโค้ดอยู่ใน R)

> sample <- c(97,98,96,100,95,97)

สำหรับการคาดเดาเริ่มต้นที่จำนวนที่คาดหวังในประชากรทั้งหมดและค่าความเชื่อมั่น 95% สำหรับราคาเราสามารถเริ่มต้นด้วยค่าเฉลี่ยและควอไทล์ 5%

> 100*mean(sample)
[1] 9716.667
> 100*quantile(sample,0.05)
  5% 
9525 

เราจะต้องสร้างแบบจำลองเชิงทฤษฎีและตั้งสมมติฐานเพิ่มเติม มีหลายแหล่งที่มาของความไม่แน่นอนในการเล่น - (1) ความไม่แน่นอนสำหรับรูปแบบการทำงานของแบบจำลองของการเติมแพ็กเก็ต (2) ความไม่แน่นอนในการประมาณค่าพารามิเตอร์สำหรับแบบจำลองและ (3) การสุ่มตัวอย่างผิดพลาด

pn=100p

> n <- 100
> (p<-1-mean(sample)/100)
[1] 0.02833333

n100np10

> (lambda <- n*p)
[1] 2.833333

λ=lambda

> var(sample)
[1] 2.966667

λr=100*lambda

> 100*100-100*lambda
[1] 9716.667
> 100*100-qpois(0.95,100*lambda)
[1] 9689

ppαβαβα=1β=0

α=1+583β=0+17

αβαβ

ทีนี้ถ้าสมมติว่าแต่ละแพ็กเก็ตถูกเติมเต็มอย่างอิสระเราสามารถดูกล่องทั้งหมดของแพ็คเก็ตเป็น 10,000 เหตุการณ์อิสระแทนที่จะเป็น 100 เหตุการณ์จาก 100 subevents ค่าเฉลี่ยจึง 9717.138 ด้วยค่าเบี่ยงเบนมาตรฐาน 69.57153 เมื่อใช้ฟังก์ชั่นการกระจายคุณสามารถคำนวณหมายเลขความมั่นใจ 95% ให้อยู่ที่ประมาณ 9593 ได้ฉันใช้แพ็คเกจ R VGAMสำหรับ*betabinom.abฟังก์ชั่นในการทำเช่นนั้น

ดังนั้นความไม่แน่นอนในพารามิเตอร์ที่ประเมินทำให้ราคาความเชื่อมั่น 95% ลดลงเกือบ 100 และท้ายที่สุดเราก็ใกล้เคียงกับการประมาณค่าเริ่มต้นง่ายๆ

ไม่ว่าจะใช้วิธีการหรือรูปแบบใดข้อมูลเพิ่มเติมสามารถใช้ในการตรวจสอบความถูกต้องของแบบจำลองนั่นคือการดูข้อมูลเพิ่มเติมมีความสมเหตุสมผลภายใต้แบบจำลองเชิงทฤษฎีหรือไม่ว่าจะเป็นการปรับหรือแบบจำลองใหม่ กระบวนการสร้างแบบจำลองคล้ายกับวิธีการทางวิทยาศาสตร์


2

ในความหยิกความโน้มเอียงแรกของฉันคือการคำนวณช่วงความมั่นใจ 95% สำหรับค่าเฉลี่ยตัวอย่างของคุณจากการแจกแจงแบบปกติที่ถูกตัดทอนซึ่งอยู่ระหว่างขอบเขตด้านล่างและด้านบนของป้าย 90 และ 100

แพ็คเกจ R truncnormช่วยให้คุณค้นหาช่วงความมั่นใจสำหรับการแจกแจงแบบปกติที่ถูกตัดทอนซึ่งมีค่าเฉลี่ยตัวอย่างที่ระบุการเบี่ยงเบนมาตรฐานตัวอย่างขอบเขตล่างและขอบบน

เนื่องจากคุณใช้ตัวอย่าง n = 5 จากประชากรที่ค่อนข้างเล็ก (N = 100) คุณอาจต้องการคูณค่าเบี่ยงเบนมาตรฐานตัวอย่างของคุณด้วยปัจจัย จำกัด ประชากร = [(Nn) / (N-1)] ^ 5 = 0.98


5
ฉันสงสัยว่าภาวะแทรกซ้อนเพิ่มเติมของการสมมติว่ามีการตัดทอนปกตินั้นมีค่า - หรือถูกต้อง - เนื่องจากการนับนั้นไม่ต่อเนื่องและสามารถรับค่าที่เป็นไปได้เพียงเล็กน้อยเท่านั้น
whuber

@whuber - จริง แต่ช่วงความมั่นใจมากกว่าการกระจายของค่าเฉลี่ยตัวอย่างซึ่งเป็นปริมาณต่อเนื่อง แทนที่จะใช้ช่วงความมั่นใจ 95% อาจเป็นทางเลือกที่ดีกว่าคือการหาพื้นที่ภายใต้การกระจายระหว่างปริมาณที่ไม่ต่อเนื่องบอกว่า 93 และ 99
RobertF

คุณไม่จำเป็นต้องตัดทอนปกติเพื่อทำงานกับค่าเฉลี่ยตัวอย่าง ดูเหมือนว่าภาวะแทรกซ้อนที่ไม่จำเป็น
whuber

1
CLT ไม่ยืนยันว่าสิ่งใดก็ตามที่จะเป็นไปตามการแจกแจงแบบปกติที่ถูกตัดทอน การบูตสแตรปมีแนวโน้มที่จะเป็นปัญหาได้เพราะมันขึ้นอยู่กับผลเชิงซีมโทติคเพื่อความถูกต้อง
whuber

1
เนื่องจากค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยอย่างรวดเร็วกลายเป็นขนาดเล็กกว่าช่วงการตัดทอนจึงไม่เกี่ยวข้องจริง เรากำลังพูดถึงวิธีแก้ปัญหาที่ใช้งานได้จริงที่ไม่ซับซ้อนโดยรายละเอียดที่ไม่จำเป็นและอาจทำให้เสียสมาธิ
whuber

2

วิธีที่ง่ายและรวดเร็วคือการพิจารณาตัวอย่างที่เป็นไปได้ทั้งหมดของขนาด 6 มีการเปลี่ยนลำดับเพียง 15,625 ครั้ง ดูสิ่งเหล่านี้และรับค่าเฉลี่ยสำหรับแต่ละกรณีจากนั้นทำการเรียงลำดับค่าเฉลี่ยและแยกควอนไทล์ 5% เราได้ค่า 96

จำนวนเงินโดยประมาณที่คุณควรจะยินดีคือประมาณ 9600 นี่เป็นข้อตกลงที่ดีกับสองสามวิธีที่ซับซ้อนกว่านี้

การปรับปรุงที่นี่คือการจำลองตัวอย่างจำนวนมากขนาด 6 และใช้กระบวนการเดียวกันเพื่อค้นหาเปอร์เซ็นไทล์ที่ 5 ของค่าเฉลี่ยตัวอย่าง เมื่อใช้ตัวอย่างมากกว่าหนึ่งล้านครั้งฉันพบว่าเปอร์เซ็นไทล์ที่ 5 เป็น 96.1667 ดังนั้นเงินดอลลาร์ที่ใกล้ที่สุดจะอยู่ที่ 9617 ดอลลาร์ซึ่งแตกต่างจาก 277 ดอลลาร์ของผลการใช้งานของผู้ใช้ 777


1
คุณช่วยอธิบายได้ไหมว่าทำไมนี่จึงเป็นคำตอบที่เหมาะสมกับจำนวนเงินที่ควรได้รับ ทำไมไม่ใช้ค่าเฉลี่ยของตัวอย่างเช่น
whuber

คุณจะใช้ค่าเฉลี่ยตัวอย่างถ้าคุณต้องการชำระเงินที่สอดคล้องกับจำนวนป้ายกำกับที่คุณคิดว่ามี แต่ผู้ถามถามถึงการรับประกัน 95% ว่าเขาไม่จ่ายเงินสำหรับฉลากมากกว่าที่ทำ เราจึงได้แนวคิดเกี่ยวกับการกระจายตัวของค่าเฉลี่ยตัวอย่างสำหรับตัวอย่างของขนาด 6 และใช้เปอร์เซ็นไทล์ที่ 5
soakley

1
มันจะเป็นการดีถ้าคุณรวมคำอธิบายนั้นไว้ในคำตอบของคุณ คุณอาจพิจารณาอธิบายว่าทำไมคุณจึงคิดว่าขั้นตอนการสุ่มตัวอย่างนี้จริง ๆ แล้วสร้างขีด จำกัด ความเชื่อมั่นที่ถูกต้องหรือเชื่อถือได้ แม้ว่าจะสามารถทำได้ด้วยชุดข้อมูลขนาดใหญ่จำนวนมาก แต่ก็ควรพิจารณาว่าสามารถใช้ในลักษณะเดียวกันกับชุดข้อมูลขนาดเล็กเช่นนั้นได้หรือไม่
whuber

0

ดูเหมือนว่าคุณได้สรุปแล้วว่าข้อผิดพลาดนั้นเกิดขึ้นโดยเจตนา แต่นักสถิติจะไม่ข้ามไปยังข้อสรุปดังกล่าว (แม้ว่าหลักฐานดูเหมือนจะสนับสนุนสิ่งนี้)

หนึ่งสามารถตั้งค่านี้เป็นแบบทดสอบสมมติฐาน:

H0: ตัวแทนจำหน่ายมีความซื่อสัตย์ แต่ค่อนข้างเลอะเทอะ

H1: ตัวแทนจำหน่ายนั้นเป็นการฉ้อโกงและการขาดแคลนมีเจตนา

สมมติว่า H0 จากนั้นแต่ละส่วนเบี่ยงเบนเป็นเหตุการณ์สุ่มที่มีค่าเฉลี่ย = 0 และโอกาสที่เท่าเทียมกันในการเป็นบวกหรือลบ เรามาสมมติว่าส่วนเบี่ยงเบนมีการแจกแจงแบบปกติ ค่าเบี่ยงเบนมาตรฐานสำหรับการแจกแจงแบบปกติโดยยึดตามความเบี่ยงเบนใน 6 จุดข้อมูลคือ sd = 1.722

หากนักสถิติจำทฤษฎีของเขาไม่ดี แต่มี R ใกล้เคียง (ไม่ใช่สถานการณ์ที่ไม่น่าเป็นไปได้) เขา / เธอสามารถเขียนรหัสต่อไปนี้เพื่อตรวจสอบโอกาสที่จะได้รับการเบี่ยงเบนที่ไม่ดี (ไม่มีแพ็คเกจมากกว่า 100) ถ้า H0 คือ จริง

numpackages=c(97,98,96,100,95,97)
error<-100-numpackages
errorStdev<-sd(error)
numSimulations<-1000000
max100orLes<-0
for(p in 1:numSimulations)
{
  simulatedError<-rnorm(6,mean=0,sd=errorStdev)

  packageDeviations<-round(simulatedError)

  maxValue<-max(packageDeviations)
  if(maxValue<=0)
  {
    max100orLes<-max100orLes+1
  }   
}
probH0<-100*max100orLes/numSimulations
cat("The probability the H0 is correct is:",probH0,"%")

ผลลัพธ์ของการจำลองคือ:

The probability the H0 is correct is: 5.3471 %

ความน่าจะเป็นของตัวแทนจำหน่ายที่มีความซื่อสัตย์เพียง 5.35% ดังนั้นจึงเป็นไปได้ว่าคุณอาจตกเป็นเหยื่อของการฉ้อโกง

เนื่องจากคุณบอกว่านี่ไม่ใช่คำถามทำการบ้าน แต่เป็นสถานการณ์จริงสำหรับ บริษัท ของคุณดังนั้นการทำแบบฝึกหัดในการคำนวณฉลากหมายเลขที่ถูกต้อง แต่แทนที่จะเป็นกรณีที่ยุ่งยากเกี่ยวกับวิธีจัดการกับซัพพลายเออร์ที่ไม่สุจริต

สิ่งที่คุณทำจากที่นี่ไม่สามารถตอบได้ด้วยสถิติเพียงอย่างเดียว มันขึ้นอยู่กับการใช้ประโยชน์และความสัมพันธ์กับตัวแทนจำหน่ายของคุณ

ขอให้โชคดี!

Gustavsen Morten Bunes


1
17/61.72/60.7017/6/0.704.01000.00003

ความล้มเหลวเป็นตัวเลือกเสมอดังนั้นฉันอาจทำผิดพลาด ... การคำนวณของฉันมีการบันทึกไว้ในรหัส R ที่ฉันให้มาดังนั้นจึงไม่มีเหตุผลใดที่จะสงสัยว่าฉันได้รับผลลัพธ์อย่างไร ใช่สมมติฐาน H0 ในกรณีของฉันคือตัวแทนจำหน่ายซื่อสัตย์แล้วความเบี่ยงเบนจะเป็นความผันผวนแบบสุ่มที่มีค่าเฉลี่ยอยู่ที่ 100 Stdev ในการคำนวณของฉันเป็นเพียง Stdev ของซีรีส์ (-3, -2, -4, 0, -5, -3) ซึ่งเป็นค่าเบี่ยงเบนจาก 100 ในแต่ละแพ็คเกจ
Morten Bunes Gustavsen

ฉันแค่ใช้การเบี่ยงเบนปกตินี้แล้วดึง 6 ตัวอย่างและตรวจสอบว่าไม่มีพวกมันใดที่ใหญ่กว่า 0 ฉันเรียกใช้การจำลอง 1,000,000 ครั้งและคิดว่ากี่ครั้งที่ฉันโชคไม่ดีที่ไม่มีตัวอย่างด้านบน 0 นี่ กลายเป็น 5.35% ของคดี เหตุผลที่ฉันเลือกมุมนี้คือคำถามที่ระบุไว้อย่างชัดเจนว่าเป็นสถานการณ์จริง (เช่นไม่ใช่แบบฝึกหัดทางวิชาการ) และเขา / เธอต้องการทราบว่านักสถิติจะทำอะไรในกรณีนี้
Morten Bunes Gustavsen

3
คำถามดังกล่าวยังไม่มีโอกาสนับมากกว่า 100 ป้ายในแพ็คเก็ต ไม่ว่าสิ่งที่คุณทำคือการจำลองตัวเลขที่มีลักษณะคล้ายข้อมูล แต่สิ่งใดที่เกี่ยวข้องกับคำถาม ("เราควรจ่ายเท่าไร") จะคลุมเครือ
whuber

-2

วิธีการเกี่ยวกับบางอย่างเช่นโมเดลพหุนาม

ผลลัพธ์ของแต่ละผลลัพธ์มีค่าประมาณ 1/6, 1/6, .... (อ้างอิงจากการสำรวจ 6 ครั้ง) และดังนั้น E (x) = 97.16 และ Var (x) = ผลรวม (95 ^ 2 * 1/6 + ... ) - E (x) ^ 2 = 2.47 ดังนั้น 95% CI จะเป็น [94, 100]


3
สิ่งนี้ดูเหมือนจะไม่เป็นพหุคูณเลย: CI ของคุณดูเหมือนจะเป็นช่วงเวลาปกติทฤษฏีโดยใช้สูตรที่ไม่แก้ไขสำหรับความแปรปรวน นอกจากนี้ยังตอบคำถามเกี่ยวกับจำนวนเงินที่ต้องชำระอย่างไร
whuber

Multinomial ใช้กับผลลัพธ์เช่น 95, 96, 97 ... 100 และใช่ CI เป็นทฤษฎีปกติเพราะ xe (x) / sd ~ N. เท่าใดการจ่ายเงินจะเท่ากับความคาดหวังดังนั้นมันจึงเท่ากับ 97.16 * 100
Xing

4
คุณสังเกตเห็นว่าคุณไม่ได้ใช้สมมติฐานพหุนามเลยหรือไม่? CI ของคุณสั้นเกินไปดังที่ WS Gosset ได้สังเกตในปี 1908 แต่ถ้าคุณจะยึดคำแนะนำของคุณตามค่าเฉลี่ยของกลุ่มตัวอย่างเท่านั้นให้คำนวณ CI ทำไม
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.