การพูดของ99%ของคะแนนในไฮเปอร์คิวบ์ ' นั้นทำให้เข้าใจผิดเล็กน้อยเนื่องจากไฮเปอร์คิวบ์มีหลายจุดไม่สิ้นสุด มาพูดถึงปริมาณแทนกัน
ปริมาตรของไฮเปอร์คิวบ์เป็นผลคูณของความยาวด้าน สำหรับ hypercube หน่วย 50 มิติเราได้รับTotal volume=1×1×⋯×150 times=150=1.
ตอนนี้ให้เราแยกขอบเขตของไฮเพอร์คิวบ์และดูที่ 'การตกแต่งภายใน ' (ฉันใส่สิ่งนี้ในเครื่องหมายคำพูดเพราะคำศัพท์ทางคณิตศาสตร์ภายในมีความหมายแตกต่างกันมาก) เราเก็บคะแนนไว้ที่ที่พอใจ
ปริมาณของ 'การตกแต่งภายใน ' นี้คืออะไร? ทีนี้ 'การตกแต่งภายใน ' เป็นไฮเปอร์คิวบ์อีกครั้งและความยาวของแต่ละด้านเท่ากับ ( ... มันช่วยให้จินตนาการได้ในสองและสามมิติ) ดังนั้นปริมาณจึงเป็นx=(x1,x2,…,x50)0.05<x1<0.95 and 0.05<x2<0.95 and … and 0.05<x50<0.95.
0.9=0.95−0.05Interior volume=0.9×0.9×⋯×0.950 times=0.950≈0.005.
เอาเป็นว่าปริมาณของ ' ขอบเขต ' (กำหนดเป็น hypercube หน่วยโดยไม่มี ' ภายใน ') คือ1−0.950≈0.995.
นี่แสดงให้เห็นว่าของปริมาตรของ hypercube 50 มิตินั้นเน้นที่ ' ขอบเขต '99.5%
การติดตามผล: Ignatiusก่อให้เกิดคำถามที่น่าสนใจเกี่ยวกับการเชื่อมโยงกับความน่าจะเป็น นี่คือตัวอย่าง
สมมติว่าคุณสร้างโมเดล (การเรียนรู้ของเครื่อง) ที่ทำนายราคาที่อยู่อาศัยตามพารามิเตอร์อินพุต 50 รายการ ทั้งหมดป้อนพารามิเตอร์ 50 มีอิสระและกระจายอย่างสม่ำเสมอระหว่างและ101
ให้เราบอกว่าแบบจำลองของคุณทำงานได้ดีมากหากไม่มีพารามิเตอร์อินพุตมาก:ตราบใดที่พารามิเตอร์อินพุตทั้งหมดอยู่ระหว่างถึงโมเดลของคุณจะทำนายราคาบ้านได้อย่างสมบูรณ์แบบ แต่ถ้าพารามิเตอร์อินพุตอย่างน้อยหนึ่งพารามิเตอร์มีค่ามาก (น้อยกว่าหรือใหญ่กว่า ) การคาดการณ์ของโมเดลของคุณจะแย่มากอย่างแน่นอน0.050.950.050.95
พารามิเตอร์ป้อนข้อมูลใด ๆ ให้เป็นมากมีโอกาสเพียง\% เห็นได้ชัดว่านี่เป็นแบบอย่างที่ดีใช่มั้ย No! ความน่าจะเป็นที่พารามิเตอร์อย่างน้อยหนึ่งในนั้นสุดขั้วคือ
ดังนั้นในของการทำนายแบบจำลองของคุณนั้นแย่มาก10%501−0.950≈0.995.99.5%
Rule of thumb: ในมิติที่สูงการสังเกตที่รุนแรงคือกฎและไม่ใช่ข้อยกเว้น