ความไม่เท่าเทียมกันของ Oracle: ในแง่พื้นฐาน


15

ฉันกำลังอ่านกระดาษที่ใช้ความไม่เท่าเทียมกันของออราเคิลเพื่อพิสูจน์บางสิ่ง แต่ฉันไม่สามารถเข้าใจสิ่งที่มันกำลังพยายามทำอยู่ เมื่อฉันค้นหาทางออนไลน์เกี่ยวกับ 'Oracle Inequality' บางแหล่งก็นำฉันไปยังบทความ "Candes, Emmanuel J. 'การประมาณทางสถิติสมัยใหม่ผ่านทางอสมการ oracle' "ซึ่งสามารถพบได้ที่นี่https://statweb.stanford.edu/~candes/papers/NonlinearEstimation.pdf แต่หนังสือเล่มนี้ดูเหมือนจะหนักเกินไปสำหรับฉันและฉันเชื่อว่าฉันขาดข้อกำหนดเบื้องต้นบางอย่าง

คำถามของฉันคือ: คุณจะอธิบายได้อย่างไรว่าความไม่เท่าเทียมกันของ oracle สำหรับสาขาวิชาที่ไม่ใช่คณิตศาสตร์ (รวมถึงวิศวกร) ประการที่สองวิธีที่คุณแนะนำให้พวกเขาไปเกี่ยวกับข้อกำหนดเบื้องต้น / หัวข้อก่อนที่จะพยายามเรียนรู้บางสิ่งบางอย่างเช่นหนังสือดังกล่าวข้างต้น

ฉันขอแนะนำว่าคนที่มีความเข้าใจอย่างเป็นรูปธรรมและมีประสบการณ์ที่ดีในสถิติมิติสูงควรตอบคำถามนี้


2
ทุกคนที่มีชื่อเสียงมากกว่า 1k สามารถให้เงินรางวัลกับคำถามนี้ได้ไหม นั่นจะช่วยได้จริงๆ ฉันไม่คิดว่าผู้ใช้ CV ทั่วไปจะคุ้นเคยกับแนวคิดนี้เนื่องจากผู้ใช้ส่วนใหญ่ใช้สถิติสำหรับการวิเคราะห์ข้อมูลและไม่ใช่การวิเคราะห์เชิงทฤษฎีแม้ว่าในฐานะชุมชนที่ใช้สถิติอย่างสมบูรณ์ แต่ฉันเชื่อว่าต้องมีคนที่สามารถตอบคำถามนี้ได้อย่างเพียงพอ ฉันเชื่อว่าคำถามยังไม่ได้รับความสนใจเพียงพอ
Wolcott

1
ฉันคิดเกี่ยวกับคำถามเดียวกัน
jeza

"คำจำกัดความ" ที่ให้ไว้ในหน้า 23 ของลิงก์ "ความไม่เท่าเทียมกันของ oracle เกี่ยวข้องกับประสิทธิภาพของตัวประมาณที่แท้จริงกับตัวประมาณอุดมคติซึ่งอาศัยข้อมูลที่สมบูรณ์แบบที่จัดทำโดย oracle ซึ่งไม่สามารถใช้ได้ในทางปฏิบัติ" สิ่งนี้ไม่ได้บอกความหมายของคำนิยามของคุณ
Mark L. Stone

2
@ Mark L. Stone สำหรับฉันมันไม่ได้
jeza

1
ไม่แม้แต่เมื่อคุณดูตัวอย่างและการสนทนาที่ให้ไว้ในประโยคสองสามข้อก่อนหน้านี้คือคำแถลงและการอภิปรายของทฤษฎีบท 4.1 เป็นตัวอย่างของความไม่เท่าเทียมของ oracle? ในแง่ของคนธรรมดา: Gee เราไม่ทราบค่าที่ดีที่สุด (จัดทำโดย oracle) ของปัจจัยการหดตัวที่เราควรใช้ แต่การรู้ว่ามูลค่าที่เหมาะสมของปัจจัยการหดตัวสามารถปรับปรุง MSE ได้ไม่เกิน 2 เทียบกับการไม่มีปัจจัยการหดตัวที่ดีที่สุดจาก oracle
Mark L. Stone

คำตอบ:


9

Yi=j=1pβjXi(j)+ϵi,i=1,...,n.
pnb
b^=(XTX)1XTY
X(b^β0)22σ2
EX(b^β0)22n=σ2np.
βj0σ2/n,j=1,...,p.(σ2/n)p.

แล้วถ้าจำนวนการสังเกตน้อยกว่าจำนวนตัวแปรอิสระล่ะ? เรา "เชื่อ" ว่าไม่ใช่ตัวแปรอิสระทั้งหมดของเราที่มีบทบาทในการอธิบายดังนั้นมีเพียงไม่กี่ตัวเท่านั้นที่บอกว่าของพวกเขานั้นไม่ใช่ศูนย์ หากเรารู้ว่าตัวแปรใดที่ไม่ใช่ศูนย์เราสามารถละเลยตัวแปรอื่นทั้งหมดและโดยการโต้แย้งข้างต้นความแม่นยำกำลังสองโดยรวมจะเป็น(p>n)Yk(σ2/n)k.

เนื่องจากชุดของตัวแปรที่ไม่ใช่ศูนย์ไม่เป็นที่รู้จักเราจำเป็นต้องมีการปรับค่าใช้จ่ายจากการทำให้เป็นมาตรฐาน (เช่น ) ด้วยพารามิเตอร์การทำให้เป็นมาตรฐาน (ซึ่งควบคุมจำนวนของตัวแปร) ตอนนี้คุณต้องการได้ผลลัพธ์ที่คล้ายกับที่กล่าวข้างต้นคุณต้องการประมาณความแม่นยำยกกำลังสอง ปัญหาคือที่ดีที่สุดของคุณประมาณการตอนนี้ขึ้นอยู่กับ\แต่ความจริงก็คือมีตัวเลือกที่เหมาะสมสำหรับคุณจะได้รับข้อผิดพลาดในการคาดเดาที่มีความน่าจะเป็นสูงนั่นคือ "oracle inequality" หมายเหตุปัจจัยเพิ่มเติมl1λβ^λλ

X(β^β0)22nconst.σ2logpnk.
logpซึ่งเป็นราคาที่ไม่ทราบชุดของตัวแปรที่ไม่เป็นศูนย์ " " ขึ้นอยู่กับหรือเท่านั้นconst.pn

พูดอย่างเคร่งครัดเราไม่ต้องการจำนวนการสังเกตให้น้อยกว่าจำนวนของตัวแปรอิสระสำหรับส่วนต่อมาทั้งหมดที่จะถูกต้อง
jbowman

คุณสามารถอธิบายได้อย่างไรว่าสมการความคาดหวัง (สมการที่สองถึงสมการสุดท้าย) และความไม่เท่าเทียมกัน (สมการสุดท้าย)
13985

X(b^β0)22σ2มีการกระจายไคสแควร์ที่มีองศาหน้าของเสรีภาพดังนั้นความคาดหวังของมันคือ P ความไม่เท่าเทียมครั้งสุดท้ายคือความไม่เสมอภาคของออราเคิล การพิสูจน์นั้นไม่สำคัญนักฉันสามารถแนะนำหนังสือเล่มนี้: สถิติสำหรับข้อมูลมิติสูง: วิธีการ, ทฤษฎีและการใช้งาน, บทที่ 6(σ2/n)p
Dato Gogolashvili
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.