เป็นไปได้ยังไงที่ฉันจะถูกสืบเชื้อสายมาจากบุคคลที่เกิดในปี 1300?


26

กล่าวอีกนัยหนึ่งตาม p ต่อไปนี้คืออะไร?

เพื่อที่จะทำให้นี่เป็นปัญหาทางคณิตศาสตร์มากกว่ามานุษยวิทยาหรือสังคมศาสตร์และเพื่อทำให้ปัญหาง่ายขึ้นสมมติว่าเพื่อนถูกเลือกด้วยความน่าจะเป็นที่เท่าเทียมกันทั่วทั้งประชากรยกเว้นว่าพี่น้องและลูกพี่ลูกน้องแรกไม่เคยผสมพันธุ์กัน รุ่น

  • n1 - ประชากรเริ่มต้น
  • g - จำนวนรุ่น
  • c - จำนวนเด็กโดยเฉลี่ยต่อคู่ (หากจำเป็นสำหรับคำตอบสมมติว่าทุกคู่มีจำนวนลูกเท่ากันทุกประการ)
  • z - เปอร์เซ็นต์ของผู้ที่ไม่มีลูกและไม่ถือว่าเป็นส่วนหนึ่งของคู่รัก
  • n2 - ประชากรในรุ่นสุดท้าย (ควรได้รับn2หรือzและ (ฉันคิดว่า) อีกอันสามารถคำนวณได้)
  • p - ความน่าจะเป็นของใครบางคนในรุ่นสุดท้ายเป็นผู้สืบทอดของบุคคลใดบุคคลหนึ่งในรุ่นแรก

แน่นอนว่าตัวแปรเหล่านี้สามารถเปลี่ยนแปลงละเว้นหรือเพิ่มเข้ามาได้ ฉันกำลังสมมติว่าความเรียบง่ายที่cและzไม่เปลี่ยนแปลงตลอดเวลา ฉันรู้นี้จะได้รับมากประมาณการคร่าวๆ แต่ก็เป็นจุดเริ่มต้น

ส่วนที่ 2 (ข้อเสนอแนะสำหรับการวิจัยเพิ่มเติม):

คุณจะพิจารณาได้อย่างไรว่าเพื่อน ๆ จะไม่ถูกเลือกด้วยความน่าจะเป็นที่เหมือนกันทั่วโลก? ในความเป็นจริงเพื่อนมีแนวโน้มที่จะมีพื้นที่ทางภูมิศาสตร์เดียวกันภูมิหลังทางเศรษฐกิจและสังคมการแข่งขันและภูมิหลังทางศาสนา หากไม่มีการศึกษาความน่าจะเป็นที่แท้จริงของสิ่งนี้แล้วตัวแปรสำหรับปัจจัยเหล่านี้จะเข้ามาเล่นได้อย่างไร สิ่งนี้สำคัญขนาดไหน?


2
นี่เป็นคำถามทำการบ้านหรือไม่ มิฉะนั้นบริบทคืออะไร?
David LeBauer

1
@John: ขอบคุณสำหรับการแก้ไขของคุณ ฉันเชื่อว่าฉันทามติทั่วไป (บนไซต์นี้และอื่น ๆ ) คือเราไม่แก้ไขคำถามเพื่อเพิ่มhomeworkแท็ก เป็นการดีกว่าสำหรับทุกคนที่เกี่ยวข้องเพื่อให้ OP ทำเช่นนั้น คุณอาจสนใจในหัวข้อเมตานี้ถ้าคุณยังไม่ได้เห็น
พระคาร์ดินัล

ฉันแค่อยากรู้ ฉันไม่ใช่นักเรียนและนี่ไม่ใช่การบ้านของใครเลย ฉันแค่ล้อเล่นเกี่ยวกับเครดิตพิเศษถึงแม้ว่าฉันจะเห็นว่ามันจะเป็นการบ้าน
xpda

3
เพื่อให้เข้าใจถึงคำตอบเบื้องต้นให้พิจารณาส่วนที่ของประชากรที่ไม่เกี่ยวข้องกับบรรพบุรุษโดยการสืบเชื้อสาย ในขั้นต้น= ( n - 1 ) / nสำหรับประชากรของn ด้วยการผสมแบบสุ่มfจะถูกยกกำลังสองหลังจากแต่ละรุ่น ในประชากรเริ่มต้นของff=(n1)/nnfพูดว่านี่หมายถึง fเกือบ 0แน่นอนหลังจาก 32รุ่น (ประมาณ 600 - 800ปี) n=108f032600800
whuber

1
ฉันเชื่อว่ามีงานวิจัยทางวิชาการเกี่ยวกับความน่าจะเป็นของนามสกุลที่ไม่ซ้ำใคร แม้ว่าจะไม่เหมือนปัญหาที่เกิดขึ้น แต่ก็อาจให้ข้อมูลเชิงลึกที่น่าสนใจ (แต่น่าเสียดายที่ฉันจำไม่ได้ว่ามาจากไหน) ผิดปกติพอฉันเชื่อว่าการศึกษาเหล่านั้นนำไปสู่ความเข้าใจในคณิตศาสตร์ที่อยู่เบื้องหลังการแพร่กระจายของโรคติดเชื้อ ...
Michael McGowan

คำตอบ:


13

เนื่องจากคำถามนี้ได้รับคำตอบที่แตกต่างจากทางดาราศาสตร์เล็กน้อยถึงเกือบ 100% ฉันจึงขอเสนอการจำลองเพื่อใช้เป็นข้อมูลอ้างอิงและแรงบันดาลใจสำหรับการแก้ปัญหาที่ได้รับการปรับปรุง

ฉันเรียกสิ่งเหล่านี้ว่า แต่ละคนบันทึกการกระจายตัวของสารพันธุกรรมภายในประชากรในขณะที่มันแพร่พันธุ์ในรุ่นต่อเนื่อง พล็อตคืออาร์เรย์ของเซ็กเมนต์แนวดิ่งบาง ๆ ที่สื่อถึงผู้คน แต่ละแถวแสดงถึงการสร้างโดยเริ่มต้นที่ด้านบน ทายาทของแต่ละรุ่นอยู่ในแถวด้านล่างทันที

ในตอนแรกมีเพียงคนเดียวในประชากรขนาดถูกทำเครื่องหมายและพล็อตเป็นสีแดง (มันยากที่จะมองเห็น แต่พวกมันจะถูกพล็อตที่ด้านขวาของแถวบนเสมอ) ทายาทสายตรงของพวกเขาจะถูกวาดด้วยสีแดง พวกเขาจะปรากฏในตำแหน่งสุ่มอย่างสมบูรณ์ ทายาทอื่นถูกลงจุดเป็นสีขาว เนื่องจากขนาดประชากรอาจแตกต่างจากรุ่นหนึ่งไปอีกรุ่นหนึ่งขอบสีเทาทางด้านขวาจะถูกใช้เพื่อเติมเต็มพื้นที่ว่างn

นี่คืออาร์เรย์ของผลการจำลองอิสระ 20 แบบ

แปลงไฟ

ในที่สุดสารพันธุกรรมสีแดงก็ตายในเก้าของการจำลองเหล่านี้ทิ้งผู้รอดชีวิตในส่วนที่เหลืออีก 11 (55%) (ในสถานการณ์สมมติเดียวด้านล่างซ้ายดูเหมือนว่าประชากรทั้งหมดจะเสียชีวิตในที่สุด) ทุกที่ที่มีผู้รอดชีวิตแม้ว่าประชากรเกือบทั้งหมดจะมีสารพันธุกรรมสีแดง สิ่งนี้แสดงหลักฐานว่าโอกาสของบุคคลที่ถูกสุ่มเลือกจากคนรุ่นสุดท้ายที่มียีนสีแดงประมาณ 50%

การจำลองการทำงานโดยการสุ่มกำหนดผู้รอดชีวิตและอัตราการเกิดเฉลี่ยที่จุดเริ่มต้นของแต่ละรุ่น ผู้รอดชีวิตมาจากการแจกแจงแบบเบต้า (6,2): เฉลี่ย 75% ตัวเลขนี้สะท้อนถึงความเป็นมรรตัยทั้งก่อนเป็นผู้ใหญ่และคนที่ไม่มีลูก อัตราการเกิดมาจากการแจกแจงแกมม่า (2.8, 1) ดังนั้นจึงมีค่าเฉลี่ย 2.8 ผลที่ได้คือเรื่องราวที่โหดร้ายของความสามารถในการสืบพันธุ์ไม่เพียงพอที่จะชดเชยการตายสูงโดยทั่วไป มันแสดงถึงโมเดลที่มองโลกในแง่ร้ายและเลวร้ายที่สุด - แต่ (ตามที่ฉันแนะนำในการแสดงความคิดเห็น) ความสามารถของประชากรในการเติบโตนั้นไม่จำเป็น สิ่งที่สำคัญในแต่ละรุ่นคือสัดส่วนของสีแดงในประชากร

ในการสร้างแบบจำลองประชากรปัจจุบันจะผอมลงไปถึงผู้รอดชีวิตโดยการสุ่มตัวอย่างแบบง่าย ๆ ตามขนาดที่ต้องการ ผู้รอดชีวิตเหล่านี้จะถูกจับคู่แบบสุ่ม (ผู้รอดชีวิตแปลก ๆ ที่เหลืออยู่หลังจากการจับคู่จะไม่ทำซ้ำ) แต่ละคู่ผลิตเด็กจำนวนหนึ่งที่ดึงมาจากการแจกแจงปัวซงซึ่งหมายถึงอัตราการเกิดของรุ่น หากผู้ปกครองคนใดคนหนึ่งมีเครื่องหมายสีแดงเด็กทุกคนจะได้รับมรดก: สิ่งนี้เป็นแบบจำลองความคิดของการสืบเชื้อสายโดยตรงผ่านผู้ปกครองทั้งสอง

ตัวอย่างนี้เริ่มต้นด้วยประชากร 512 และเรียกใช้การจำลองสำหรับรุ่นที่ 11 (12 แถวรวมถึงจุดเริ่มต้น) การเปลี่ยนแปลงของการจำลองนี้เริ่มต้นเพียงไม่กี่และมากถึง2 14 = 16 , 384คนโดยใช้จำนวนผู้รอดชีวิตและอัตราการเกิดที่แตกต่างกันทั้งหมดมีลักษณะคล้ายกัน: ในตอนท้ายของบันทึก2 ( n )รุ่น (เก้า) ในกรณีนี้) มีโอกาสประมาณ 1/3 ที่สีแดงทั้งหมดเสียชีวิต แต่ถ้าไม่เป็นเช่นนั้นประชากรส่วนใหญ่จะเป็นสีแดง ภายในสองหรือสามรุ่นประชากรเกือบทั้งหมดเป็นสีแดงและจะยังคงเป็นสีแดง (หรือประชากรจะตายไปพร้อมกัน)n=8214=16,384log2(n)

ผู้รอดชีวิต 75% หรือน้อยกว่าในรุ่นนั้นไม่ได้เป็นคนเพ้อฝัน ในปลายปี 1347 หนูที่ถูกรบกวนด้วยโรคกาฬโรคนั้นได้เดินทางจากเอเชียไปยังยุโรป ในช่วงสามปีถัดไปมีผู้เสียชีวิตระหว่าง 10% ถึง 50% ของประชากรยุโรป กาฬโรคกำเริบเกือบหนึ่งครั้งในรุ่นต่อมาหลายร้อยปีหลังจากนั้น


รหัส

การจำลองถูกสร้างขึ้นด้วยMathematica 8:

randomPairs[s_List] := Partition[s[[Ordering[RandomReal[{0, 1}, Length[s]]]]], 2];

next[s_List, survive_, nKids_] := Flatten[ConstantArray[Max[#], 
   RandomVariate[PoissonDistribution[nKids]]] & /@ 
   randomPairs[RandomSample[s, Ceiling[survive Length[s]]]]] 

Partition[Table[
   With[{n = 6}, ArrayPlot[NestList[next[#, RandomVariate[BetaDistribution[6, 2]], 
        RandomVariate[GammaDistribution[3.2, 1]]] &, 
        Join[ConstantArray[0, 2^n - 1], ConstantArray[1, 1]], n + 2], 
     AspectRatio -> 2^(n/3)/(2 n), 
     ColorRules -> {1 -> RGBColor[.6, .1, .1]},  
     Background -> RGBColor[.9, .9, .9]]
    ], {i, 1, 20}
   ], 4] // TableForm

1
ฉันคิดว่าการสร้างแบบจำลองเช่นนี้อาจเป็นวิธีที่ดีที่สุด มันง่ายกว่าและสนุกกว่า (สำหรับฉัน) มากกว่าคณิตศาสตร์และมันควรทำให้ง่ายขึ้นมากในการแนะนำปัจจัยที่ จำกัด การเลือกคู่ครอง คุณมีคำแนะนำคำเตือนหรือคำแนะนำอื่น ๆ ก่อนที่ฉันจะดำน้ำในเรื่องนี้หรือไม่?
xpda

3
@xpda โซลูชันทางคณิตศาสตร์จะให้ข้อมูลเชิงลึกเกี่ยวกับสิ่งที่สำคัญและสิ่งที่ไม่ ตัวอย่างเช่นพวกเขาจะแสดงว่าคุณไม่จำเป็นต้องสร้างแบบจำลองประชากรขนาดใหญ่ พวกเขายังจะระบุบทบาทที่เล่นโดยความแปรปรวนซึ่งยากที่จะจัดการวิเคราะห์และมาก่อนในการจำลอง
whuber

1
@whuber คุณทำการจำลองใน Mathematica หรือไม่? คุณต้องการรหัสการโพสต์หรือไม่
สันนิษฐานว่าปกติ

1
@ Max รหัสอยู่ในขณะนี้ ฉันขอโทษที่ไม่มีความคิดเห็น ถ้าคุณทำงานแต่ละrandomPairsและnextจากข้อมูลการทดสอบฟังก์ชั่นของพวกเขาควรกลายเป็นที่ชัดเจน สังเกตการใช้NestListเพื่อย้ำnextเพื่อผลิตหลายชั่วอายุคน
whuber

3

จะเกิดอะไรขึ้นเมื่อคุณลองนับบรรพบุรุษ

คุณมี 2 พ่อแม่ปู่ย่าตายายที่ 4, 8 ทวด ... ดังนั้นถ้าคุณกลับไปชั่วอายุคนแล้วคุณมี2 nบรรพบุรุษ สมมติว่าความยาวเฉลี่ยรุ่น25ปี จากนั้นก็มีประมาณ28รุ่นตั้งแต่ 1300 ซึ่งให้เราประมาณ 268 ล้านบรรพบุรุษในเวลานั้นn2n2528

นี่คือสนามเบสบอลที่ถูกต้อง แต่มีบางอย่างผิดปกติกับการคำนวณนี้เนื่องจากประชากรของโลกในปี 1300 ไม่ได้ผสมกันอย่างสม่ำเสมอและเราไม่สนใจการแต่งงานระหว่างต้นไม้ "บรรพบุรุษ" ของคุณนั่นคือเรานับบรรพบุรุษของเราเป็นสองเท่า

ถึงกระนั้นฉันก็คิดว่าสิ่งนี้สามารถนำไปสู่ขอบเขตบนที่ถูกต้องเกี่ยวกับความน่าจะเป็นที่คนที่ถูกสุ่มเลือกในปี 1300 เป็นบรรพบุรุษของคุณโดยใช้อัตราส่วนต่อประชากรใน 1300228


2
สำคัญมากเมื่อพิจารณาจากจำนวนประชากรในตอนนั้นค่อนข้างห่างไกลจากกันดังนั้นจึงมีโอกาสน้อยมากที่จะหลีกเลี่ยงการแต่งงานระหว่างกัน
dcl

2
สมมุติว่า OP มาจากเชื้อสายอังกฤษและประมาณ 1300 ประชากรของอังกฤษมีมากกว่าหนึ่งล้าน (สมมติว่าก่อนที่จะเกิดความอดอยากครั้งใหญ่) สิ่งนั้นจะเปลี่ยนการวิเคราะห์ของคุณอย่างไร
dassouki

ล้านไม่ใช่พันล้าน มันเป็นสนามเบสบอลที่ถูกต้อง 228268
whuber

D'โอ้! แก้ไขคำตอบ การคำนวณยังคงละเว้นแต่งงาน แต่ตอนนี้อาจจะให้ถูกต้องขอบเขตบนความเป็นไปได้ว่าคนที่สุ่มเลือกใน 1300 นั้นบรรพบุรุษของคุณโดยการส่วน: หรือ4ร้อยล้าน 228/34
vqv

2

ยิ่งคุณย้อนกลับไปได้มากเท่าไหร่โอกาสที่คุณจะเกี่ยวข้องกับคนที่ประสบความสำเร็จในการถ่ายทอดยีนของพวกเขาที่อาศัยอยู่ในช่วงเวลานั้นจะยิ่งมากขึ้นเท่านั้น จากบรรพบุรุษ 1/4 พันล้านคนที่คุณเคยอาศัยอยู่ในปี 1300 หลายคนจะแสดงหลายร้อยครั้ง (หากไม่ใช่พันล้านล้านครั้ง) ในแผนภูมิต้นไม้ครอบครัวของคุณ การเบี่ยงเบนทางพันธุกรรมและจำนวนครั้งที่เราเกี่ยวข้องโดยตรงกับใครบางคนน่าจะเกี่ยวข้องกับความแตกต่างในรหัสพันธุกรรมของเรามากกว่าที่บรรพบุรุษของเราเป็น


0

ความน่าจะเป็น = 1-z, ผู้สืบทอดทุกคนในปัญหานี้เกี่ยวข้องกับบรรพบุรุษข้างต้น ไม่ว่าอัตราเริ่มต้นของการทำสำเนาคืออะไร (1-z) ความน่าจะเป็นของคุณในการสืบเชื้อสายมาจากใครบางคนในประชากรเริ่มต้นความน่าจะเป็นที่ไม่แน่นอนเพียงอย่างเดียวคือโอกาสในการมีชีวิตอยู่ในประชากรสุดท้าย

ฉันเห็นด้วยกับคำตอบของ Erad แม้ว่าตอนนี้ฉันคิดว่ามันตอบสนองต่อคำถามที่ไม่ได้ถาม - นั่นคือความเป็นไปได้ที่คุณยังมีชีวิตอยู่จากข้อ จำกัด ด้านการเจริญพันธุ์และการรับรู้ของประชากร


คำถามคือการหาความน่าจะเป็นของคนในรุ่นสุดท้ายที่สืบเชื้อสายมาจากบุคคลใดบุคคลหนึ่งในรุ่นแรก ถ้า = 360 ล้านและz = .2 ดังนั้นความน่าจะเป็นจะไม่เท่ากับ 1- zที่ตัวอย่างเช่นg = 1 n1zzg
xpda

นอกจากนี้เพื่อชี้แจงคำถามคือการค้นหาความน่าจะเป็นของบุคคลใดบุคคลหนึ่งในรุ่นสุดท้ายที่สืบเชื้อสายมาจากบุคคลหนึ่งในรุ่นแรก
xpda

1
AAAA

@ cogito ของ Wipa Descartes , ผลรวมที่ยิ่งใหญ่บ่งบอกถึงความน่าจะเป็นที่ฉันยังมีชีวิตอยู่ได้รับข้อ จำกัดใด ๆเกี่ยวกับบรรพบุรุษของฉันคือ 100% :-)
whuber

@whuber คุณถูกต้อง ฉันเชื่อว่าเรากำลังพูดถึงปัญหาเดียวกัน สิ่งที่ฉันต้องการชี้แจงคือฉันไม่ได้มองหาโอกาสของใครบางคนในรุ่นแรกที่มีลูกหลานที่ยังมีชีวิตอยู่ในรุ่นที่ผ่านมา ฉันกลัวว่า Wipa จะมาพร้อมกับ (1-z) เพื่อหาคำตอบ
xpda

0

p>(1z)×1n1(1z)2=2n1

คำตอบอธิบาย:
จากบุคคลใดบุคคลหนึ่งในวันนี้เป็นที่แน่นอนว่าพวกเขาเป็นทายาทของอย่างน้อย 2 คนในปี 1300

เมื่อเลือกบุคคลใดบุคคลหนึ่งในปี 1300 มีโอกาส (1-z) ที่บุคคลไม่เคยทำซ้ำและอีกคำหนึ่งมีไว้สำหรับจำนวนของ 'ผู้ปกครองคู่' และความน่าจะเป็นที่บุคคลนั้นจะเกี่ยวข้องกับคู่นี้ (1 / จำนวนคู่)

p>2n1


nk+1=nk(1z)×c2=n1(1z)kck2k







p>2/360,000,000=5.56×109

ขอขอบคุณที่อ่าน Erad


cz

ตามคำถามดั้งเดิมด้านบน: c = จำนวนเด็กโดยเฉลี่ยต่อคู่และ z = เปอร์เซ็นต์ของผู้ที่ไม่มีบุตร
Erad

2
1/n1/360M109

3
360,000,000/(2.66×10249)1

1
108

0

นี่เป็นคำถามที่น่าสนใจมากเพราะเราขอให้เราแก้เศษส่วนทางคณิตศาสตร์ ที่มีชื่อเสียงเช่นเกมของชีวิต

พี1=2n1 และเมื่อถึงขีด จำกัด การผลิตจะเข้าใกล้ Limkพีk=(1-Z).

ถ้าเราแสดงว่า พีk เป็นโอกาสของคนในรุ่น kที่จะเกี่ยวข้องกับประชากรเริ่มต้น และเพื่อความง่ายช่วยให้ผ่อนคลายกฎพี่น้องและญาติ (สามารถเพิ่มในภายหลัง) แล้ว:

พี1=2n1

ในฐานะที่เป็นคนในแต่ละรุ่นใหม่มีตรง 2 บรรพบุรุษในประชากรเริ่มต้น

p2=relatives×2n2+non.relatives×4n2
In this case relatives could be calculated as:
relatives=(c2)×nc(n2)=c1n1
Or in other words, the number of sibling combinations, times the number of siblings family, divided by the total mating combinations.
p3=immediate.relatives×4n3+cousins×6n3+non.relatives×8n3

With each generation, the probability to be related to someone at the initial population will undoubtedly grow, but at a decreasing pace. This is because the probability to draw "relatives" which are coming from the same or similar tree will grow.

Lets use ethnicity as an example. Lets say we know for a fact someone is 100% Caucasian. At generation 28 he is most likely related to a significant portion of the Caucasian population in 1300 (As shown by @whuber simulation). Lets say he is marrying someone who is 100% of a different ethnicity. Their offspring will be linked to approximately double the number of people they are linked to from 1300.

Another interesting thought is that given the human (homosapien) race started from ~600 people in Africa, then we are most likely a genetic permutation of all of them who successfully mated.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.