การเปลี่ยนแปลงทางสถิติในสองรูปแบบที่มีคุณสมบัติตามสูตร 1


15

ฉันเพิ่งอ่านบทความ BBC นี้เกี่ยวกับรูปแบบที่เหมาะสมในสูตร 1

ผู้จัดงานต้องการทำให้การคาดการณ์มีคุณสมบัติน้อยลงเช่นเพื่อเพิ่มความแปรปรวนทางสถิติในผลลัพธ์ การรวบรวมรายละเอียดที่ไม่เกี่ยวข้องในตอนนี้ผู้ขับขี่ได้รับการจัดอันดับจากรอบที่ดีที่สุดจากสองรอบ

นายฌองท็อดท์หัวหน้า F1 คนหนึ่งเสนอว่าการจัดอันดับผู้ขับขี่โดยเฉลี่ยสองรอบจะเพิ่มความแปรปรวนทางสถิติเนื่องจากไดรเวอร์อาจมีความผิดพลาดเป็นสองเท่า แหล่งข้อมูลอื่นแย้งว่าค่าเฉลี่ยใด ๆ ย่อมลดความผันแปรทางสถิติ

เราสามารถพูดได้ว่าใครถูกภายใต้สมมติฐานที่สมเหตุสมผล? ฉันคิดว่ามันเดือดลงกับความแปรปรวนแบบสัมพัทธ์ของค่าเฉลี่ย(x,Y)เทียบกับโดยที่และเป็นตัวแปรสุ่มที่เป็นตัวแทนของสองรอบตัก?x yนาที(x,Y)xY

คำตอบ:


5

ฉันคิดว่ามันขึ้นอยู่กับการกระจายของรอบเวลา

ปล่อย เป็นอิสระกระจายตัวเหมือนกันX,Y

  1. ถ้าจากนั้นVar(P(X=0)=P(X=1)=12VaR(X+Y2)=18<VaR(นาที(X,Y))=316.
  2. อย่างไรก็ตามหากจากนั้น V a r (P(X=0)=0.9,P(X=100)=0.1VaR(X+Y2)=450>VaR(นาที(X,Y))=99

สิ่งนี้สอดคล้องกับข้อโต้แย้งที่กล่าวถึงในคำถามเกี่ยวกับการทำผิดพลาด (เช่นการใช้เวลานานเป็นพิเศษกับความน่าจะเป็นเล็กน้อย) ดังนั้นเราจะต้องรู้การกระจายเวลารอบในการตัดสินใจ


น่าสนใจฉันคิดว่าบางอย่างเช่นนี้ใช้ได้กับ rv ต่อเนื่องเช่นกัน มีข้อผิดพลาดอะไรในหลักฐานก่อนหน้า?
innisfree

1
เท่าที่ฉันเข้าใจมันให้เหตุผลว่าระยะห่างระหว่างxและค่าเฉลี่ยนั้นน้อยกว่าระยะห่างระหว่างxและmin ( x , y )เสมอดังนั้นความแปรปรวนของค่าเฉลี่ยจะต้องเล็กกว่าความแปรปรวนของนาที( x , Y ) อย่างไรก็ตามสิ่งนี้ไม่เป็นไปตาม: min ( x , y )xyxxmin(x,y)min(x,y)min(x,y)สามารถอยู่ได้ไกลอย่างต่อเนื่องในขณะที่ค่าเฉลี่ยแตกต่างกันมาก หากการพิสูจน์นั้นขึ้นอยู่กับการคำนวณจริงมันจะง่ายกว่าที่จะระบุจุดที่แน่นอนที่มันผิดพลาด (หรือตรวจสอบว่ามันถูกต้องหลังจากทั้งหมด)
sandris

2

โดยไม่สูญเสียความเป็นปรกติสมมติว่าและ varaibles ทั้งสองนั้นมาจากการแจกแจงแบบเดียวกันโดยมีค่าเฉลี่ยและความแปรปรวนเฉพาะYx

ปรับปรุงเมื่อ { x }โดย{Y,x}{x}

กรณีที่ 1 หมายถึง: ,Y-x2

กรณีที่ 2 นาที: xY-x

ดังนั้นค่าเฉลี่ยมีผลต่อการปรับปรุงครึ่งหนึ่ง (ซึ่งถูกขับเคลื่อนด้วยความแปรปรวน) มากกว่าการทำขั้นต่ำ (สำหรับการทดลอง 2 ครั้ง) นั่นคือค่าเฉลี่ยลดความแปรปรวน


ฉันไม่มั่นใจว่าสิ่งนี้ค่อนข้างถูกต้องคุณช่วยอธิบายอย่างเป็นทางการได้ไหม?
sandris

2

นี่คือหลักฐานการ Var [Mean] ของฉัน

สำหรับตัวแปรสุ่ม 2 ตัว x, y มีความสัมพันธ์ระหว่างค่าเฉลี่ยกับค่าสูงสุดและค่าต่ำสุด

ดังนั้น 4

2Mอีan(x,Y)=Mผมn(x,Y)+Max(x,Y)
ถ้าเราคิดว่าการกระจายนั้นสมมาตรรอบค่าเฉลี่ยแล้ว V a r [ M ฉันn ( x , y ) ] = V a r [ M a x ( x , y ) ] จากนั้น 4
4VaR[Mอีan]=VaR[Mผมn]+VaR[Max]+2โอโวลต์[Mผมn,Max]
VaR[Mผมn(x,Y)]=VaR[Max(x,Y)]
และ C o v [ M i n , M a x ] < = s q r t ( V a r [ M i n ] V a r [ M a x ] ) = V a r [ M i n ] ดังนั้น V
4VaR[Mอีan]=2VaR[Mผมn]+2โอโวลต์[Mผมn,Max]
โอโวลต์[Mผมn,Max]<=sQRเสื้อ(VaR[Mผมn]VaR[Max])=VaR[Mผมn]
นอกจากนี้ยังเห็นได้ง่ายจากแหล่งที่มาว่าเพื่อย้อนกลับความไม่เท่าเทียมกันนี้คุณต้องมีการแจกแจงที่มีการตัดปลายคมชัดมากของการกระจายด้านลบ ความหมาย. ตัวอย่างเช่นสำหรับการแจกแจงแบบเอ็กซ์โพเนนเชียลค่าเฉลี่ยมีความแปรปรวนขนาดใหญ่กว่าค่านาที
VaR[Mอีan]<=VaR[Mผมn]

1

เป็นคำถามที่ดีขอบคุณ! ฉันเห็นด้วยกับ @sandris ว่าการแจกแจงรอบเวลามีความสำคัญ แต่อยากจะเน้นว่าประเด็นเชิงสาเหตุของคำถามต้องได้รับการแก้ไข ฉันเดาว่า F1 ต้องการหลีกเลี่ยงสถานการณ์ที่น่าเบื่อที่ทีมหรือคนขับคนเดียวกันครอบครองกีฬาปีแล้วปีเล่าและพวกเขาหวังเป็นอย่างยิ่งว่าจะนำเสนอความตื่นเต้นของความเป็นไปได้จริงที่ผู้ขับรถใหม่ 'ร้อน' สามารถทำได้ ทันใดนั้นเกิดขึ้นในกีฬา

นั่นคือฉันเดาว่ามีความหวังที่จะทำลายการจัดอันดับทีม / ไดรเวอร์ที่เสถียรมากเกินไป (พิจารณาการเปรียบเทียบกับการเพิ่มอุณหภูมิในการอบแบบจำลอง ) คำถามก็จะกลายเป็นว่าอะไรคือปัจจัยเชิงสาเหตุในที่ทำงานและวิธีการที่พวกเขากระจายไปทั่วประชากรของผู้ขับขี่ / ทีมเพื่อสร้างความได้เปรียบอย่างต่อเนื่องสำหรับผู้ครอบครองตลาดปัจจุบัน (พิจารณาคำถามที่คล้ายคลึงกันในการจัดเก็บภาษีมรดกสูงเพื่อ 'ยกระดับสนามเด็กเล่น' ในสังคมโดยรวม)

n

สมมติว่าความล้มเหลวของเครื่องยนต์นั้นเป็นเหตุการณ์ที่ไม่สามารถควบคุมได้ซึ่งมีความน่าจะเป็นเหมือนกันในทุกทีมและการจัดอันดับปัจจุบันสะท้อนการไล่ระดับสีอย่างถูกต้องในคุณภาพของผู้ขับขี่ / ทีมในหลาย ๆ ปัจจัย ในกรณีนี้ความโชคร้ายของความล้มเหลวของเครื่องยนต์สัญญาว่าจะเป็น 'ปัจจัยการปรับระดับ' ที่โดดเดี่ยวที่ F1 สามารถใช้ประโยชน์เพื่อให้เกิดโอกาสที่เท่าเทียมกันมากขึ้น - อย่างน้อยที่สุดก็ต้องไม่มีการจัดอันดับอย่างหนัก ในกรณีนี้นโยบายที่ลงโทษความล้มเหลวของเครื่องยนต์อย่างรุนแรง (ซึ่งเป็นปัจจัยเดียวในสถานการณ์นี้ที่ไม่ได้ใช้งานได้ค่อนข้างดีสำหรับผู้ครอบครองตลาด) สัญญาว่าจะส่งเสริมความไม่แน่นอนในการจัดอันดับ ในกรณีนี้นโยบายที่ดีที่สุดที่กล่าวถึงข้างต้นจะเป็นนโยบายที่ผิดพลาดอย่างแน่นอน


0

โดยทั่วไปฉันเห็นด้วยกับคำตอบอื่น ๆ ที่ค่าเฉลี่ยของการวิ่งสองครั้งจะมีความแปรปรวนต่ำกว่า แต่ฉันเชื่อว่าพวกเขากำลังทิ้งประเด็นสำคัญที่อยู่ภายใต้ปัญหา มีหลายสิ่งที่เกี่ยวข้องกับวิธีที่ผู้ขับขี่มีปฏิกิริยาต่อกฎและกลยุทธ์ของพวกเขาในการคัดเลือก

ตัวอย่างเช่นเมื่อมีรอบคัดเลือกเพียงรอบเดียวผู้ขับขี่จะต้องระมัดระวังมากขึ้นและคาดการณ์ได้มากขึ้นและน่าเบื่อมากขึ้น แนวคิดที่มีสองรอบคือการอนุญาตให้ผู้ขับขี่ใช้โอกาสในการลอง "Lap Lap ที่สมบูรณ์แบบ" ซึ่งมีอีกอันสำหรับการวิ่งแบบอนุรักษ์นิยม การวิ่งมากขึ้นจะใช้เวลามากซึ่งอาจเป็นเรื่องน่าเบื่อ การตั้งค่าปัจจุบันอาจเป็น "จุดที่น่าสนใจ" เพื่อให้ได้รับการดำเนินการมากที่สุดในกรอบเวลาที่สั้นที่สุด

โปรดทราบด้วยวิธีการหาค่าเฉลี่ยผู้ขับขี่จำเป็นต้องหาเวลารอบที่ทำได้ซ้ำได้เร็วที่สุด ด้วยวิธีการขั้นต่ำผู้ขับขี่จำเป็นต้องขับรถให้เร็วที่สุดเท่าที่จะทำได้เพียงรอบเดียวอาจจะผลักไปไกลกว่าที่พวกเขาจะใช้วิธีการเฉลี่ย

การสนทนานี้ใกล้เคียงกับทฤษฎีเกมมากขึ้น คำถามของคุณอาจได้คำตอบที่ดีกว่าเมื่อวางกรอบในแสงนั้น จากนั้นหนึ่งสามารถเสนอเทคนิคอื่น ๆ เช่นตัวเลือกสำหรับคนขับที่จะลดเวลารอบแรกในความโปรดปรานของการวิ่งครั้งที่สองและอาจเป็นเวลาที่เร็วขึ้นหรือช้าลง เป็นต้น

โปรดทราบว่าในปีนี้มีการพยายามเปลี่ยนการคัดเลือกเพื่อผลักดันคนขับให้เข้าสู่รอบอนุรักษ์หนึ่งครั้ง https://en.wikipedia.org/wiki/2016_Formula_One_season#Qualifying ผลลัพธ์ถูกมองว่าเป็นภัยพิบัติและถูกยกเลิกอย่างรวดเร็ว

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.