เป็นไปได้ว่าตัวแปรสุ่มสองตัวจากตระกูลการแจกจ่ายเดียวกันมีความคาดหวังและความแปรปรวนเหมือนกัน แต่ช่วงเวลาที่สูงกว่าต่างกันหรือไม่


12

ฉันกำลังคิดถึงความหมายของครอบครัวในระดับตำแหน่ง ความเข้าใจของฉันคือสำหรับสมาชิกทุกคนในตระกูลมาตราส่วนตำแหน่งที่ตั้งที่มีพารามิเตอร์ตำแหน่งและมาตราส่วนจากนั้นการกระจายของไม่ขึ้นอยู่กับพารามิเตอร์ใด ๆ และมันก็เหมือนกันสำหรับทุกที่เป็นของตระกูลนั้นXabZ=(Xa)/bX

ดังนั้นคำถามของฉันคือคุณสามารถให้ตัวอย่างที่สุ่มสองตัวจากตระกูลการแจกจ่ายเดียวกันเป็นมาตรฐาน แต่ไม่ส่งผลให้ตัวแปรสุ่มที่มีการแจกแจงแบบเดียวกันได้หรือไม่

พูดว่าและมาจากตระกูลการแจกจ่ายเดียวกัน (โดยที่ครอบครัวฉันหมายถึงตัวอย่างเช่น Normal หรือ Gamma และอื่น ๆ .. ) กำหนด:XY

Z1=Xμσ

Z2=Yμσ

เรารู้ว่าทั้งสองและมีความคาดหวังเหมือนกันและแปรปรวน 1Z1Z2μZ=0,σZ2=1

แต่พวกเขาสามารถมีช่วงเวลาที่สูงขึ้นแตกต่างกันได้หรือไม่

ความพยายามของฉันที่จะตอบคำถามนี้คือถ้าการแจกแจงของและขึ้นอยู่กับพารามิเตอร์มากกว่า 2 ตัว และฉันกำลังคิดถึง general ทั่วไปที่มี 3 พารามิเตอร์XYtstudent

แต่ถ้าจำนวนพารามิเตอร์คือและและมาจากตระกูลการกระจายเดียวกันที่มีความคาดหวังและความแปรปรวนเหมือนกันหมายความว่าและมีการแจกแจงแบบเดียวกัน (ช่วงเวลาที่สูงขึ้น) หรือไม่2XYZ1Z2


4
ใช่พวกเขาสามารถ แต่คุณจะต้องมีพารามิเตอร์อย่างน้อย 3 ตัวในการแจกแจงแบบทั่วไป
Carl

5
@Carl One พารามิเตอร์จะพอเพียง
whuber

5
@Carl มันไม่ชัดเจนว่าคุณหมายถึงอะไรโดย "การกระจายเดียวกัน" แท้จริงแล้วจะหมายถึงการกระจายที่ไม่ซ้ำกันโดยมีกฎหมายเดียวและดังนั้นจึงมีความคาดหวังที่ไม่ซ้ำกันความแปรปรวนที่ไม่ซ้ำกันและช่วงเวลาที่ไม่ซ้ำกัน ถ้าคุณหมายถึง " ตระกูลการกระจายตัวเดียวกัน" คำพูดของคุณนั้นไร้ความหมายเพราะครอบครัวคือสิ่งที่คุณกำหนดให้เป็น
whuber

3
@HardCore เนื่องจากดูเหมือนว่าคุณรู้สึกว่าคำถามของคุณได้รับคำตอบโปรดดูฉันควรทำอย่างไรเมื่อมีคนตอบคำถามของฉัน
Glen_b -Reinstate Monica

2
@Carl ฉันก็ตอบคำตอบของคุณด้วย การใช้งานของ OP ดูเหมือนว่าจะสนับสนุนแนวคิดของเนื่องจากมีการกระจายมาตรฐานแบบเดียวกันสำหรับตัวเลือกทั้งหมดของในตระกูล ลองดูคำตอบที่ OP ยอมรับ (ถ้า OP อ่านความคิดเห็นของ Glen_b และดำเนินการกับมัน) XZ=(Xa)/bX
Dilip Sarwate

คำตอบ:


7

เห็นได้ชัดว่ามีความสับสนเกี่ยวกับตระกูลของการแจกแจงและวิธีการนับพารามิเตอร์ฟรีกับพารามิเตอร์ฟรีและคงที่ (กำหนด) คำถามเหล่านั้นเป็นสิ่งที่ไม่เกี่ยวข้องกับเจตนาของ OP และจากคำตอบนี้ ฉันไม่ได้ใช้คำว่าครอบครัวในที่นี้เพราะมันทำให้เกิดความสับสน ตัวอย่างเช่นตระกูลตามแหล่งเดียวคือผลลัพธ์ของการเปลี่ยนแปลงพารามิเตอร์รูปร่าง @whuber ระบุว่า"การกำหนดพารามิเตอร์" ของตระกูลนั้นเป็นแผนที่ต่อเนื่องจากเซตย่อยของwithโดยมีโทโพโลยีทั่วไปอยู่ในพื้นที่ของการกระจายซึ่งมีภาพคือครอบครัวนั้น n ฉันจะใช้รูปแบบคำที่ครอบคลุมทั้งการใช้งานที่ตั้งใจของคำ x 2 -2x+4 a 2 x 2 + a 1 x+ a 0 a 1 =0 a 2 =0การระบุตระกูลและพารามิเตอร์และการนับ ตัวอย่างเช่นสูตรมีรูปแบบของสูตรกำลังสองเช่นและถ้าสูตรยังคงเป็นรูปสี่เหลี่ยมกำลังสอง อย่างไรก็ตามเมื่อสูตรเป็นเส้นตรงและแบบฟอร์มไม่สมบูรณ์เพียงพอที่จะมีคำที่มีรูปร่างเป็นกำลังสอง ผู้ที่ต้องการที่จะใช้คำว่าครอบครัวในบริบททางสถิติที่เหมาะสมมีกำลังใจที่จะนำไปสู่คำถามที่แยกต่างหากที่x2-2x+4a2x2+a1x+a0a1=0a2=0

ให้เราตอบคำถามว่า "พวกเขามีช่วงเวลาที่แตกต่างกันหรือไม่" มีตัวอย่างมากมาย เราทราบว่าในการผ่านคำถามนี้ดูเหมือนจะเกี่ยวกับ PDF สมมาตรซึ่งเป็นคำถามที่มีแนวโน้มที่จะมีสถานที่ตั้งและขนาดในกรณีที่พารามิเตอร์ bi ง่าย ตรรกะ: สมมติว่ามีฟังก์ชั่นความหนาแน่นสองฟังก์ชั่นที่มีรูปร่างแตกต่างกันซึ่งมีพารามิเตอร์ที่เหมือนกันสองตำแหน่ง (ตำแหน่งระดับ) จากนั้นจะมีพารามิเตอร์รูปร่างที่ปรับรูปร่างหรือฟังก์ชั่นความหนาแน่นไม่มีพารามิเตอร์รูปร่างทั่วไปจึงเป็นฟังก์ชันความหนาแน่นของรูปแบบทั่วไป

นี่คือตัวอย่างของวิธีที่พารามิเตอร์รูปร่างมีรูปร่างเป็นอย่างไร ทั่วไปฟังก์ชั่นความหนาแน่นของข้อผิดพลาดและนี่คือคำตอบที่ดูเหมือนจะมีความโด่งเลือกได้อย่างอิสระ

ป้อนคำอธิบายรูปภาพที่นี่

โดย Skbkekas - งานของตัวเอง CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=6057753

ฟังก์ชันความหนาแน่นของความน่าจะเป็น PDF (AKA "ความน่าจะเป็น" โปรดทราบว่าคำว่า "ความน่าจะเป็น" นั้นไม่จำเป็น) คือ

β2αΓ(1β)อี-(|x-μ|α)β

ค่าเฉลี่ยและตำแหน่งคือมาตราส่วนคือและคือรูปร่าง โปรดทราบว่ามันง่ายกว่าที่จะนำเสนอ PDF แบบสมมาตรเนื่องจากไฟล์ PDF เหล่านั้นมักจะมีตำแหน่งและสเกลเป็นพารามิเตอร์สองกรณีที่ง่ายที่สุดในขณะที่ PDF แบบอสมมาตรเช่นแกมมา PDFมีแนวโน้มที่จะมีรูปร่างและขนาดเป็นพารามิเตอร์กรณีที่ง่ายที่สุด ต่อเนื่องกับฟังก์ชันความหนาแน่นของข้อผิดพลาดความแปรปรวนคือความเบ้เป็นและ kurtosis คือμαβอัลฟ่า2 Γ ( 3α2Γ(3β)Γ(1β)0Γ(5β)Γ(1β)Γ(3β)2-3. ดังนั้นหากเราตั้งค่าความแปรปรวนเป็น 1 เราจะกำหนดค่าของจากในขณะที่ที่แตกต่างกันเพื่อให้โด่งคือเลือกได้ในช่วงตั้งแต่ไป\αα2=Γ(1β)Γ(3β)β>0-0.601114

นั่นคือถ้าเราต้องการเปลี่ยนแปลงช่วงเวลาการสั่งซื้อที่สูงขึ้นและถ้าเราต้องการรักษาค่าเฉลี่ยของศูนย์และความแปรปรวนเท่ากับ 1 เราต้องเปลี่ยนรูปร่าง นี่หมายถึงสามพารามิเตอร์ซึ่งโดยทั่วไปคือ 1) ค่าเฉลี่ยหรือมิฉะนั้นการวัดที่ตั้งที่เหมาะสม 2) ขนาดเพื่อปรับความแปรปรวนหรือการวัดความแปรปรวนอื่น ๆ และ 3) รูปร่าง มันใช้เวลาอย่างน้อยสามพารามิเตอร์ในการทำมัน

โปรดทราบว่าหากเราทำการแทนที่ ,ใน PDF ด้านบนเราจะได้รับβ=2α=2σ

อี-(x-μ)22σ22πσ,

ซึ่งเป็นฟังก์ชันความหนาแน่นของการแจกแจงแบบปกติ ดังนั้นฟังก์ชั่นความหนาแน่นข้อผิดพลาดทั่วไปคือลักษณะทั่วไปของฟังก์ชั่นความหนาแน่นของการแจกแจงปกติ มีหลายวิธีในการสรุปฟังก์ชันความหนาแน่นของการแจกแจงแบบทั่วไป อีกตัวอย่างหนึ่ง แต่มีฟังก์ชั่นความหนาแน่นของการกระจายปกติเท่านั้นเป็นค่า จำกัด และไม่ได้มีค่าทดแทนช่วงกลางทั่วไปเช่นฟังก์ชั่นความหนาแน่นของข้อผิดพลาดเป็นนักศึกษา 's ฟังก์ชันความหนาแน่น การใช้ของนักเรียนฟังก์ชั่นความหนาแน่นของเราจะมีตัวเลือกค่อนข้าง จำกัด มากขึ้นของความโด่งและเป็นพารามิเตอร์รูปร่างเพราะช่วงเวลาที่สองไม่ได้มีอยู่สำหรับ<2 ยิ่งกว่านั้นdf-เสื้อ-เสื้อDF2DF<21 - t dfไม่ จำกัด จริงกับค่าจำนวนเต็มบวกมันเป็นจริงทั่วไป\นักเรียนกลายเป็นปกติในขีด จำกัด เป็นซึ่งเป็นเหตุผลที่ฉันไม่ได้เลือกมันเป็นตัวอย่าง มันไม่ใช่ตัวอย่างที่ดีหรือเป็นตัวอย่างที่เคาน์เตอร์และในครั้งนี้ฉันไม่เห็นด้วยกับ @ ซีอานและ @whuber1-เสื้อDF

ให้ฉันอธิบายเพิ่มเติมต่อไป เราสามารถเลือกฟังก์ชั่นความหนาแน่นตามอำเภอใจสองตัวของพารามิเตอร์สองตัวที่มีตัวอย่างเช่นค่าเฉลี่ยของศูนย์และความแปรปรวนของหนึ่ง อย่างไรก็ตามพวกเขาจะไม่ทั้งหมดอยู่ในรูปแบบเดียวกัน อย่างไรก็ตามคำถามเกี่ยวข้องกับฟังก์ชั่นความหนาแน่นของแบบฟอร์มเดียวกันไม่ใช่แบบฟอร์มที่แตกต่างกัน การอ้างสิทธิ์ได้ทำขึ้นแล้วว่าฟังก์ชันความหนาแน่นใดมีรูปแบบเดียวกันคือการมอบหมายโดยพลการเนื่องจากนี่เป็นเรื่องของคำจำกัดความและในความเห็นของฉันนั้นแตกต่างกัน ฉันไม่เห็นด้วยว่านี่เป็นกฎเกณฑ์เนื่องจากเราสามารถทำการทดแทนเพื่อแปลงฟังก์ชันความหนาแน่นหนึ่งฟังก์ชันให้เป็นฟังก์ชันอื่นได้หรือไม่สามารถทำได้ ในกรณีแรก, ฟังก์ชั่นความหนาแน่นจะคล้ายกัน, และโดยการแทนที่เราสามารถแสดงว่าฟังก์ชันความหนาแน่นไม่เท่ากัน, ฟังก์ชันความหนาแน่นเหล่านั้นมีรูปแบบที่แตกต่างกัน

ดังนั้นการใช้ตัวอย่างของนักศึกษาของ PDF, เลือกที่มีทั้งพิจารณาให้เป็นลักษณะทั่วไปของรูปแบบไฟล์ PDF ปกติซึ่งในกรณีที่ไฟล์ PDF ปกติมีรูปแบบที่อนุญาตสำหรับนักศึกษาของ 's PDF, หรือไม่ ซึ่งในกรณีของนักเรียน 's PDF เป็นรูปแบบที่แตกต่างจากรูปแบบไฟล์ PDF ปกติจึงไม่เกี่ยวข้องกับคำถามที่ถูกวาง-เสื้อ-เสื้อ-เสื้อ

เราสามารถโต้แย้งได้หลายวิธี ความเห็นของผมก็คือว่ารูปแบบไฟล์ PDF ปกติเป็นรูปแบบย่อยเลือกของนักเรียน 's PDF, แต่ที่ไฟล์ PDF ปกติไม่ได้เป็นย่อยการเลือกของแกมมา PDF แม้ว่าค่าการ จำกัด ของแกมมา PDF สามารถแสดงให้เห็นว่า เป็น PDF ปกติและเหตุผลของฉันคือในกรณีปกติ / Student 'การสนับสนุนเหมือนกัน แต่ในกรณีปกติ / gamma การสนับสนุนไม่มีที่สิ้นสุดกับ semi-infinite ซึ่งเป็นความไม่ลงรอยกันที่จำเป็น .-เสื้อ-เสื้อ


6
(-1) ดังที่ได้กล่าวไว้ในความคิดเห็นอื่น ๆ ปัญหาคือ "ตระกูลการแจกจ่ายหมายถึงอะไร" ฉันสามารถกำหนด "ครอบครัว" ใหม่ของการแจกแจงแบบง่ายๆที่ช่วยลดการแจกแจงแบบ t เพื่อให้มีค่าเฉลี่ย = 0, sd = 1 ด้วยพารามิเตอร์เดียว: df จากนั้นช่วงเวลาที่ 1 และ 2 จะเท่ากันสำหรับ df ทั้งหมด แต่สำหรับค่า df ที่แตกต่างกัน
หน้าผา AB

5
ฮาร์ดคอร์ความคิดเห็นนั้นยากที่จะเข้าใจเนื่องจากชื่อของคุณมีคำว่า "ครอบครัว"! ยิ่งกว่านั้นถ้าคุณปฏิเสธว่าครอบครัวมีความหมายแล้วคำถามก็ไม่สมเหตุสมผล โปรดอธิบายโดยแก้ไขคำถามของคุณเพื่อสะท้อนถึงความตั้งใจของคุณ
whuber

5
-1 เนื่องจากคุณเริ่มต้นด้วยการพูดว่า "คำตอบคือไม่" จากนั้นให้ทำตัวอย่างที่ตอบได้อย่างมีประสิทธิภาพใช่ (อีกตัวอย่างหนึ่งให้ไว้ในคำตอบของ kjetilbhalvorsen ที่คุณพูดถึงอย่างเหมาะสม) สิ่งนี้ไม่สมเหตุสมผลสำหรับฉัน ฉันคิดว่าคณิตศาสตร์ที่นี่มีความชัดเจนสำหรับเราทุกคนดังนั้น downvote ของฉันมีไว้สำหรับการนำเสนอที่ไม่สอดคล้องกันเท่านั้น
อะมีบา

3
คาร์ลมีความไม่สอดคล้องกันระหว่างคำถามกับความคิดเห็นของฮาร์ดคอร์ คำถามชัดเจน: ถึง "ให้ตัวอย่างที่สุ่ม [ตัวแปร] จากตระกูลการแจกจ่ายเดียวกันสองมาตรฐาน แต่ที่ไม่ส่งผลใน ... ตัวแปรสุ่ม [s] กับการกระจายเดียวกัน" เห็นได้ชัดว่ามีความหมายบางอย่างของ "ครอบครัว" ไว้ ความหมายปกติชัดเจนแม้ว่าจะมีหลากหลายสายพันธุ์ทางเทคนิครอบ ๆ และคำตอบที่ถูกต้อง (แสดงให้เห็นได้ง่าย) คือ "ใช่มีตัวอย่างมากมาย"
whuber

4
ขอบคุณ. เห็นได้ชัดว่าคุณมีความคิดที่ดีเกี่ยวกับสิ่งที่คุณเขียน แต่น่าเสียดายที่โพสต์ของคุณเผยแพร่ค่อนข้างสับสนเกี่ยวกับความหมายของ "การกระจาย" รูปร่าง "" รูปแบบ "" และ "พารามิเตอร์" เป็นตัวอย่างหนึ่งของรายละเอียดปลีกย่อยให้พิจารณาตระกูลการแจกแจงที่สร้างขึ้นโดยกฎการกระจายใด ๆที่มีช่วงเวลากลางที่ไม่ใช่ศูนย์สาม ครอบครัวจัดทำดัชนีสองตัวเลขจริงและประกอบด้วยกฎหมายทั้งหมดMU) มันเป็นสถานที่ที่เหมาะสำหรับครอบครัวขนาด แต่รูปร่างของกฎหมายเหล่านี้แตกต่างกันไปขึ้นอยู่กับสัญลักษณ์ของ\( μ , σ 0 ) x F ( σ x + μ ) σF(μ,σ0)xF(σx+μ)σ
whuber

17

หากคุณต้องการตัวอย่างซึ่งเป็น "ตระกูลการแจกแจงแบบกำหนดพารามิเตอร์อย่างเป็นทางการคุณสามารถตรวจสอบการแจกแจงแกมม่าทั่วไปได้ที่https://en.wikipedia.org/wiki/Generalized_gamma_distributionตระกูลการแจกจ่ายนี้มีพารามิเตอร์สามตัวดังนั้นคุณสามารถแก้ไขค่าเฉลี่ยได้ และความแปรปรวนและยังคงมีอิสระในการเปลี่ยนแปลงช่วงเวลาที่สูงขึ้นจากหน้า wiki พีชคณิตไม่ได้ดูน่าชวนชวนฉันอยากจะทำมันเป็นตัวเลขสำหรับแอปพลิเคชันทางสถิติให้ค้นหาไซต์นี้สำหรับ gamlss ซึ่งเป็นส่วนเสริมของเกม รุ่นในตัวเองเป็นลักษณะทั่วไปของ glm's) ซึ่งมีพารามิเตอร์สำหรับ "สถานที่ตั้งขนาดและรูปร่าง"

อีกตัวอย่างหนึ่งคือ -distribution ซึ่งขยายเป็นตระกูลระดับตำแหน่ง จากนั้นพารามิเตอร์ตัวที่สามจะเป็นดีกรีอิสระซึ่งจะระวังรูปร่างของตำแหน่งและสเกลที่แน่นอนt


1
แม้ว่าการกระจายข้อผิดพลาดทั่วไปอาจเป็นทางเลือกที่ดีกว่า
Carl

2
ขอบคุณมากสำหรับคำตอบของคุณ!! ฉันเลือกคาร์ลเพราะมีรายละเอียดมากกว่านี้ แต่ก็ดีเหมือนกัน .. ขอบคุณมาก !!!
gioxc88

14

มีจำนวนอนันต์ของการแจกแจงที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนอันหนึ่งดังนั้นรับจากการแจกแจงแบบใดแบบหนึ่งเหล่านี้พูดและจากการแจกแจงแบบอื่นพูดนักเรียนกับ 54 องศาอิสระ rescaled โดยเพื่อให้มันแปรปรวนเป็นหนึ่งแล้ว เพลิดเพลินไปกับคุณสมบัติที่คุณพูดถึง พารามิเตอร์ "จำนวน" ไม่เกี่ยวข้องกับคุณสมบัติN ( 0 , 1 ) ϵ 2 t ϵ1N(0,1)ϵ2t X=μ+σϵ113

X=μ+σϵ1andY=μ+σϵ2

เห็นได้ชัดว่าถ้าคุณตั้งกฎเพิ่มเติมเพื่อนิยามของตระกูลนี้เช่นระบุว่ามีความหนาแน่นคงที่เช่นนั้นความหนาแน่นของคือคุณอาจท้ายด้วยการกระจายที่เป็นไปได้เดียวX 1fX

1σdf({xμ}/σ)

ขอบคุณสำหรับคำตอบ แต่ฉันคิดว่านี่ไม่ใช่สิ่งที่ฉันถาม
gioxc88

6
ฉันคิดว่ามันเป็นเพราะถ้าครอบครัวของการแจกแจงถูกกำหนดโดยการรวมกันของทั้งการแจกแจงของและคุณก็มีความขัดแย้งกับคุณสมบัติ "ครอบครัว" ของการแจกแจงเป็นแนวคิดที่คลุมเครือ YXY
ซีอาน

ใช่ในความเป็นจริงค่อนข้างคลุมเครือ แต่ถ้าคุณอ่านคำถามของฉันฉันเขียนว่าในบริบทนี้กับครอบครัวฉันหมายถึงตัวอย่างทั้ง Normal หรือ Gamma และอื่น ๆ .. คุณทำตัวอย่างกับนักเรียนปกติหนึ่งคนและนักเรียนหนึ่งคน
gioxc88

4
ฮาร์ดคอร์, คุณดูเหมือนจะสับสนชื่อของครอบครัวที่มีแนวคิด คำตอบนี้เป็นคำตอบที่ดีและแสดงให้เห็นแนวคิดอย่างชัดเจน คำถามของคุณไม่ได้ถามว่าการแก้ปัญหาเป็นครอบครัวในระดับตำแหน่ง หากคุณต้องการให้เป็นหนึ่งคุณสามารถใช้คำตอบนี้ - หรือคำตอบอื่น ๆ - และขยายไปยังครอบครัวระดับตำแหน่งโดยการอนุญาตการแปลและ rescalings โดยพลการ ประเด็นของซีอานเกี่ยวกับจำนวนพารามิเตอร์ยังคงมีอยู่
whuber

@ ใครฉันคิดว่ามันเป็นคำตอบที่สับสน นักเรียน -t ด้วยตัวเองจะเป็นคำตอบที่ดีกว่าใช้คำตอบมากของและไม่ได้ระบุ อันที่จริงมันคือซึ่งเป็นพารามิเตอร์ที่สาม d fdf=3,df
Carl

6

ฉันคิดว่าคุณกำลังถามว่าตัวแปรสุ่มสองตัวที่มาจากตระกูลระดับตำแหน่งเดียวกันนั้นสามารถมีค่าเฉลี่ยและความแปรปรวนเหมือนกันหรือไม่ คำตอบคือไม่

พิสูจน์ : ให้และเป็นตัวแปรสุ่มสองตัว เนื่องจากและอยู่ในตระกูลระดับตำแหน่งเดียวกันจึงมีตัวแปรสุ่มและตัวเลขจริงซึ่งและb_2 เนื่องจากและมีค่าเฉลี่ยและความแปรปรวนเหมือนกันเราจึง:X 2 X 1 X 2 X a 1 > 0 , a 2 > 0 , b 1 , b 2 X 1 d = a 1 X + b 1 X 2 d = a 2 X + b 2 X 1 X 2X1X2X1X2Xa1>0,a2>0,1,2X1=da1X+1X2=da2X+2X1X2

  1. E[X1]=E[X2]a1E[X]+1=a2E[X]+2b_2
  2. var[X1]=var[X2]a12var[X]=a22var[X][X]

ถ้าดังนั้นมีความน่าจะเป็นและด้วยเหตุนี้ช่วงเวลาที่สูงขึ้นของและจะเท่ากันทั้งหมด ดังนั้นเราอาจคิดว่า0 เมื่อใช้สิ่งนี้ (2) ก็หมายความว่า. ตั้งแต่และ , เรามีในความจริงที่ว่าa_1ในทางกลับกัน (1) ข้างต้นในขณะนี้ก็หมายความว่าb_1เรามี: สำหรับใด ๆเช่นทุกช่วงเวลาของและX 1 = E [ X 1 ] = X 2 = E [ X 2 ] 1 X 1 X 2 Var [ X ] 0 | 1 | = | 2 | a 1 > 0 a 2 > 0 a 1 = a 2 b 1 = b 2Var[X]=0X1=E[X1]=X2=E[X2]1X1X2Var[X]0|a1|=|a2|a1>0a2>0a1=a2b1=b2k X 1 X 2

E[X1k]=E[(a1X+b1)k]=E[(a2X+b2)k]=E[X2k],
kX1X2 มีความเท่าเทียมกัน

1
(+1) ฉันไม่สามารถหาข้อผิดพลาดได้จากคำตอบนี้ เห็นได้ชัดว่ามีคนทำและพวกเขาก็พบความผิดกับฉัน ฉันไม่เข้าใจพฤติกรรมที่ไม่ได้อธิบายนี้
Carl

5
@Carl คำตอบนี้ไม่ถูกต้อง - นั่นเป็นสาเหตุที่มันถูกลดระดับลง ซีอานจัดทำตัวอย่างตัวอย่างแล้ว
whuber

1
@whuber โปรดดูความคิดเห็นของฉันภายใต้คำตอบของซีอาน ฉันไม่เห็นด้วยกับเขา แต่ไม่ได้ลงคะแนนเพราะทั้งเขาและคุณมีสิทธิ์ในความคิดเห็นของคุณแม้ว่าฉันคิดว่ามันไม่ถูกต้อง
Carl

8
@Carl หลังจากอ่านคำตอบนี้อีกครั้งฉันต้องถอนการประเมินเดิมของฉัน: คำตอบนี้ถูกต้อง (และ +1 สำหรับสิ่งนั้น) และมันถูกต้องเพราะมันอธิบายได้อย่างชัดเจนว่ามันตีความคำถามเดิมอย่างไร (โดยเฉพาะมีแนวคิดทั่วไป แต่แคบของ "ตระกูลระดับตำแหน่ง" ซึ่งประกอบด้วยการกระจายมาตรฐานเดียวพร้อมกับการแปลทั้งหมดและการปรับขนาดเชิงบวก) ฉันเชื่อว่าคำถามดั้งเดิมตั้งใจถามบางสิ่งที่แตกต่างออกไปเล็กน้อย พื้นฐานของความเชื่อนั้นคือการอ้างอิงถึงพารามิเตอร์มากกว่าสองรายการในโพสต์
whuber

2
ฉันขอโทษถ้าฉันยังไม่ชัดเจนมากและฉันขอขอบคุณสำหรับเวลาที่คุณได้ใช้เวลาดูสิ่งนี้ แต่นั่นไม่ใช่สิ่งที่ฉันถาม
gioxc88

1

เนื่องจากคำถามสามารถตีความได้หลายวิธีฉันจะแยกคำตอบนี้ออกเป็นสองส่วน

  • A: ครอบครัวกระจาย
  • B: ตระกูลการกระจายในระดับตำแหน่ง

ปัญหาเกี่ยวกับกรณี A สามารถตอบ / แสดงได้ง่าย ๆ โดยหลายครอบครัวที่มีพารามิเตอร์รูปร่าง

ปัญหาเกี่ยวกับกรณี B นั้นยากกว่าเนื่องจากพารามิเตอร์หนึ่งพารามิเตอร์ครึ่งนั้นเพียงพอที่จะระบุตำแหน่งและสเกล (ตำแหน่งในและสเกลใน ) และปัญหาจะกลายเป็นว่า สามารถใช้พารามิเตอร์สองตัวเพื่อเข้ารหัสรูปร่าง (หลายตัว) ได้เช่นกัน เรื่องนี้ไม่สำคัญเลย เราสามารถมาพร้อมกับตระกูลมาตราส่วนตำแหน่งที่ตั้งพารามิเตอร์สองแบบได้อย่างง่ายดายและแสดงให้เห็นว่าคุณไม่มีรูปร่างที่แตกต่างกัน แต่ก็ไม่ได้พิสูจน์ว่านี่เป็นกฎถาวรสำหรับตระกูลระดับตำแหน่งพารามิเตอร์สองพารามิเตอร์ใด ๆRR>0

ตอบ: การแจกแจงสองแบบที่แตกต่างจากตระกูลการกระจายพารามิเตอร์ 2 ตัวเดียวกันมีค่าเฉลี่ยและความแปรปรวนเหมือนกันหรือไม่

คำตอบคือใช่และสามารถแสดงได้โดยใช้หนึ่งในตัวอย่างที่กล่าวถึงอย่างชัดเจน: การแจกแจงแกมมาปกติ

ตระกูลของการแจกแจงแกมมาปกติ

ปล่อยให้ด้วย a แกมมากระจายตัวแปร การกระจาย (สะสม) ของมีดังนี้:Z=X-μσXZ

FZ(Z;k)={0ถ้าZ<-k1Γ(k)γ(k,Zk+k)ถ้าZ-k

โดยที่เป็นฟังก์ชันแกมม่าที่ไม่สมบูรณ์γ

ดังนั้นที่นี่จึงเป็นกรณีที่และที่แตกต่างกัน(การแจกแจงจากตระกูลของการแจกแจงแกมมาปกติ) สามารถมีค่าเฉลี่ยและความแปรปรวนเหมือนกัน (คือและ ) แต่แตกต่างกันตามพารามิเตอร์ ( พารามิเตอร์ 'รูปร่าง') นี่คือการเชื่อมโยงอย่างใกล้ชิดกับความจริงที่ว่าครอบครัวของการแจกแจงแกมมาไม่ได้เป็นครอบครัวระดับสถานที่Z1Z2μ=0σ=1k

B: การกระจายสองแบบที่แตกต่างกันจากตระกูลการกระจายขนาดพารามิเตอร์ 2 ตำแหน่งเดียวกันมีค่าเฉลี่ยและความแปรปรวนเหมือนกันหรือไม่

ฉันเชื่อว่าคำตอบคือไม่ถ้าเราพิจารณาเฉพาะตระกูลที่ราบรื่น (ราบรื่น: การเปลี่ยนแปลงเล็กน้อยในพารามิเตอร์จะส่งผลให้เกิดการเปลี่ยนแปลงเล็กน้อยของการกระจาย / ฟังก์ชัน / เส้นโค้ง) แต่คำตอบนั้นไม่ค่อยน่าสนใจและเมื่อเราจะใช้ครอบครัวทั่วไป (ไม่ราบเรียบ) มากกว่านี้เราก็สามารถตอบตกลงได้แม้ว่าครอบครัวเหล่านี้จะมีอยู่ในทฤษฎีเท่านั้นและไม่มีความเกี่ยวข้องในทางปฏิบัติ

การสร้างตระกูลระดับตำแหน่งจากการกระจายแบบครั้งเดียวโดยการแปลและการปรับสเกล

จากการกระจายเดี่ยวใด ๆ โดยเฉพาะเราสามารถสร้างตระกูลระดับตำแหน่งด้วยการแปลและปรับ ถ้าเป็นฟังก์ชันความหนาแน่นของความน่าจะเป็นของการแจกแจงเดี่ยวดังนั้นฟังก์ชันความหนาแน่นของความน่าจะเป็นสำหรับสมาชิกในครอบครัวจะเป็น(x)

(x;μ,σ)=1σ(x-μσ)

สำหรับครอบครัวระดับตำแหน่งที่สามารถสร้างได้ในลักษณะดังกล่าวเรามี:

  • สำหรับสมาชิกสองคนและถ้าค่าเฉลี่ยและความแปรปรวนเท่ากันจากนั้น(x;μ1,σ1)(x;μ2,σ2)(x;μ1,σ1)=(x;μ2,σ2)

สำหรับครอบครัวที่มีขนาดตามตำแหน่งพารามิเตอร์ทั้งสองสามารถกระจายการเป็นสมาชิกของพวกเขาจากการกระจายสมาชิกเดี่ยวโดยการแปลและการปรับขนาด

ดังนั้นการแปลและการปรับสเกลสามารถแปลงการแจกแจงเดี่ยวให้เป็นตระกูลระดับตำแหน่ง คำถามคือว่าการย้อนกลับเป็นจริงหรือไม่และทุกตระกูลพารามิเตอร์ตำแหน่งสองขนาด (ซึ่งพารามิเตอร์และไม่จำเป็นต้องตรงกับตำแหน่งและมาตราส่วน ) สามารถอธิบายได้โดยการแปลและการปรับ ของสมาชิกคนเดียวจากครอบครัวนั้นθ1θ2μσ

สำหรับตระกูลขนาดตำแหน่งพารามิเตอร์สองแบบเช่นตระกูลของการแจกแจงแบบปกติมันไม่ยากเกินไปที่จะแสดงว่าพวกมันสามารถสร้างขึ้นได้ตามกระบวนการข้างต้น (การปรับขนาดและการแปลของสมาชิกตัวอย่างเดียว)

หนึ่งอาจสงสัยว่ามันเป็นไปได้สำหรับทุกสองพารามิเตอร์ครอบครัวตั้งขนาดจะถูกสร้างออกมาจากสมาชิกโดยการแปลและปรับ หรือคำแถลงที่ขัดแย้งกัน: "ครอบครัวขนาดพารามิเตอร์สองตำแหน่งสามารถมีการแจกแจงสมาชิกที่แตกต่างกันสองรายการที่มีค่าเฉลี่ยและความแปรปรวนเดียวกันได้หรือไม่" ซึ่งเป็นสิ่งจำเป็นที่ครอบครัวต้องเป็นสมาชิกสหภาพของครอบครัวย่อยหลายครอบครัว การปรับขนาด

กรณีที่ 1: ครอบครัวของการแจกแจงแบบทั่วไปของนักเรียนซึ่งมีพารามิเตอร์สองตัว

ตัวอย่างที่ถูกประดิษฐ์เกิดขึ้นเมื่อเราทำการแมปจากไปเป็น ( cardinality-of-mathbbr-and-mathbbr2 ) ซึ่งอนุญาตให้อิสระในการใช้พารามิเตอร์สองตัวและเพื่ออธิบายการรวมกันของครอบครัวย่อยหลายครอบครัว สร้างขึ้นโดยการแปลและการปรับขนาดR2R3θ 1 θ 2θ1θ2

ลองใช้การแจกแจงทั่วไปของ t (พารามิเตอร์สามตัว):

(x;ν,μ,σ)=Γ(ν+12)Γ(ν2)πνσ(1+1ν(x-μσ)2)-ν+12

เมื่อพารามิเตอร์ทั้งสามเปลี่ยนไปดังนี้

μ=สีน้ำตาล(θ1)σ=θ2ν=0.5+θ1/π

จากนั้นเรามี

(x;θ1,θ2)=Γ(0.5+θ1/π+12)Γ(0.5+θ1/π2)π0.5+θ1/πθ2(1+10.5+θ1/π(x-สีน้ำตาล(θ1)θ2)2)-0.5+θ1/π+12

ซึ่งอาจพิจารณาว่าเป็นพารามิเตอร์ระดับครอบครัวสองตำแหน่ง (แม้ว่าจะไม่ค่อยมีประโยชน์) ซึ่งไม่สามารถสร้างได้โดยการแปลและการปรับขนาดของสมาชิกเพียงคนเดียว

กรณีที่ 2: ตระกูลระดับตำแหน่งที่สร้างโดยการปรับขนาดเชิงลบของการแจกแจงเดี่ยวด้วยค่าที่ไม่ใช่ศูนย์

ตัวอย่างที่มีการประดิษฐ์น้อยกว่าการใช้ฟังก์ชั่นแทนซาเนียนั้นได้รับจาก Whuber ภายใต้ความเห็นของคำตอบของคาร์ล เราสามารถมีครอบครัวโดยที่การพลิกสัญญาณของทำให้ค่าเฉลี่ยและความแปรปรวนไม่เปลี่ยนแปลง แต่อาจเปลี่ยนแปลงช่วงเวลาที่สูงขึ้นไม่สม่ำเสมอ ดังนั้นสิ่งนี้จะช่วยให้ครอบครัวตระกูลพารามิเตอร์ตำแหน่งสองขนาดง่ายขึ้นซึ่งสมาชิกที่มีค่าเฉลี่ยและความแปรปรวนเดียวกันสามารถมีช่วงเวลาการสั่งซื้อที่สูงขึ้นแตกต่างกัน ตัวอย่างจาก Whuber สามารถแบ่งออกเป็นสองครอบครัวย่อยซึ่งแต่ละอันสามารถสร้างขึ้นจากสมาชิกคนเดียวโดยการแปลและการปรับสเกลx(x/+a)

ครอบครัวราบรื่น

หากเราพยายามทำให้การกระจายพารามิเตอร์สองอย่างราบรื่น (ราบรื่น: การเปลี่ยนแปลงเล็กน้อยในพารามิเตอร์จะส่งผลให้เกิดการเปลี่ยนแปลงเล็กน้อยของการแจกแจง / ฟังก์ชัน / เส้นโค้ง) โดยการสร้างองค์ประกอบของครอบครัวสองครอบครัวขึ้นไปที่สร้างขึ้นโดยการแปล และการปรับขนาดจากนั้นเราจะพบปัญหาเพื่อให้พารามิเตอร์ทั้งสองครอบคลุมทั้งการเปลี่ยนแปลงของ 'ค่าเฉลี่ย' และ 'ความแปรปรวน' เช่นเดียวกับพารามิเตอร์ที่สาม 'รูปร่าง' หลักฐานที่เป็นทางการจะต้องไปตามบรรทัดเดียวกับคำตอบของคำถาม: มีฟังก์ชั่น surjective ที่ราบรื่นหรือไม่? :R2R3(ที่คำตอบคือไม่ในกรณีที่ราบรื่นเช่น. ฟังก์ชั่นที่แตกต่างกันอนันต์แม้ว่าจะมีอย่างต่อเนื่อง ฟังก์ชั่นที่จะทำงานเช่น Peano curves)

สัญชาตญาณ: ลองนึกภาพว่าจะมีพารามิเตอร์ ,ที่อธิบายการแจกแจงในตระกูลการกระจายขนาดตำแหน่งและเราสามารถเปลี่ยนค่าเฉลี่ยและความแปรปรวนเช่นเดียวกับช่วงเวลาอื่น ๆ จากนั้นเราควรจะสามารถแสดง , , ในแง่ของค่าเฉลี่ยและความแปรปรวนθ1θ2θ1θ2μσ

θ1=θ1(μ,σ)θ2=θ2(μ,σ)

แต่สิ่งเหล่านี้จำเป็นต้องมีฟังก์ชั่นที่มีคุณค่าหลายอย่างและสิ่งเหล่านี้ไม่สามารถทำการเปลี่ยนอย่างต่อเนื่องได้ค่าที่แตกต่างจากสำหรับและนั้นไม่ต่อเนื่องและจะไม่สามารถ ทำโมเดลพารามิเตอร์รูปร่างอย่างต่อเนื่องθ1(μ,σ)μσ

จริง ๆ แล้วฉันไม่แน่ใจเกี่ยวกับส่วนสุดท้ายนี้ เราอาจใช้เส้นโค้งการเติมช่องว่าง (เช่นเส้นโค้ง Peano ถ้าเพียง แต่เรารู้วิธีแสดงพิกัดบนเส้นโค้งถึงพิกัดของ hypercube) เพื่อให้มีพารามิเตอร์เดียวแบบจำลองคุณสมบัติหลายอย่างสมบูรณ์เช่นค่าเฉลี่ยและความแปรปรวนโดยไม่มี การละทิ้งคุณสมบัติที่การเปลี่ยนแปลงเล็กน้อยของพารามิเตอร์เทียบเท่ากับการเปลี่ยนแปลงเล็กน้อยของฟังก์ชันทุก ๆθ1θ1(x;θ1)x


1
ฉันหยุดอ่านหลังจากคำจำกัดความเริ่มต้นเพราะมันไม่ชัดเจนและขัดแย้งกัน โดย "บูรณาการ" แน่นอนว่าคุณหมายถึงการรวมกันมากกว่าเท่านั้น xแม้ว่า โดย " " คุณต้องหมายถึง CDF ไม่ใช่ PDF เนื่องจากการหารด้วยจะเปลี่ยนอินทิกรัล โดยไม่กำหนดข้อ จำกัด ใด ๆ เกี่ยวกับวิธีการที่สามารถแตกต่างกับคุณยังนำแนวคิดที่กว้างกว่าของ "ครอบครัว" มากกว่าปกติ เฉพาะที่ช่วยให้คุณสามารถหารือ "แผนที่จากถึง " ปัญหาเกี่ยวกับ "แผนที่" เหล่านี้คือพวกเขาไม่สามารถต่อเนื่องได้และจะไม่มีความหมายทางสถิติ,1θR2R3.

2
ฉันไม่ได้คัดค้านความเรียบง่ายหรือภาษา แต่เพื่อความสับสนที่กำลังหว่าน ปัญหาเกี่ยวกับแผนที่ชี้ให้เห็นว่าทำไมคุณต้องกำหนดโครงสร้างทางคณิตศาสตร์เพิ่มเติม - โครงสร้างที่เหมาะสม - กับครอบครัว การอนุญาตให้การกระจายการเปลี่ยนแปลงในลักษณะที่ไม่ต่อเนื่อง (รุนแรง) กับไม่เพียง แต่ไม่สามารถใช้งานได้และไร้ความหมายเท่านั้น แต่ก็น่าจะทำให้วิธีการและทฤษฎีที่มีประโยชน์เป็นโมฆะโดยไม่มีเหตุผลที่ดี ตัวอย่างเช่น MLE จะดำเนินการเกือบตลอดเวลาภายใต้สมมติฐานว่าการกระจายแตกต่างกันกับในลักษณะที่แตกต่างกันทีละชิ้น R2R3θθ
whuber

1
สัญลักษณ์แสดงหัวข้อย่อยที่สองไม่ถูกต้อง: ไม่เป็นไปตามสมมติฐานใด ๆ หรือเป็นส่วนหนึ่งของคำจำกัดความของตระกูลระดับตำแหน่ง
whuber

1
มันสับสนอย่างมากเพราะตอนนี้การอ้างอิงทั้งหมดไปยังนั้นไม่จำเป็น ฉันเชื่อว่าตัวระบุปริมาณตอนนี้ในแถลงการณ์ของคุณอาจถ่ายทอดความคิดที่คุณมีไม่ถูกต้อง ทำไมไม่ลองวางและบอกว่าครอบครัวประกอบด้วยชุดของการแจกแจงสำหรับหนึ่งชุดที่ให้และทั้งหมดพร้อม ? ไม่จำเป็นต้องอ้างถึงความหมายและความแปรปรวนไม่ว่าจะเป็นสิ่งที่ทำให้ไขว้เขวจากความคิดที่สำคัญซึ่งไม่ต้องการให้มีช่วงเวลาใด ๆ เลย θผมθผมxF(x+a)F(a,)R2>0F
whuber

1
@whuber ถ้าคุณจะสร้างครอบครัวที่ตั้งขนาดจากตัวอย่างเดียวแล้วแน่นอนมันจะดูเหมือนมันง่ายมากที่จะใช้และ\นี่ฉัน แต่จินตนาการว่าเรามีครอบครัวของเส้นโค้งแปรโดยทางเลือกบางและและผมสงสัยว่ามันอาจจะเป็นไปได้ว่าครอบครัวดังกล่าวมีมากขึ้นโค้งมากกว่าเพียงแค่เส้นโค้งที่สร้างขึ้นโดยการปรับสมาชิกหนึ่งเดียวกับและ (เช่นเดียวกับในการแปลงกับแทนเจนต์) ฉันจะดูว่าฉันสามารถเปลี่ยนสูตรได้อีกหรือไม่ (คุณไม่เห็นด้วยกับแนวคิดหรือสูตรนั้น) μσθ1θ2μσ
Sextus Empiricus
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.