คำถามติดแท็ก bounds

3
วิธีการทางสถิติสำหรับข้อมูลที่ทราบเพียงค่าต่ำสุด / สูงสุด
มีสาขาของสถิติที่เกี่ยวข้องกับข้อมูลที่ไม่ทราบค่าที่แน่นอนแต่สำหรับแต่ละคนเรารู้ว่าค่าสูงสุดหรือต่ำสุดผูกกับค่าหรือไม่ ฉันสงสัยว่าปัญหาของฉันส่วนใหญ่มาจากความจริงที่ว่าฉันพยายามดิ้นรนเพื่อให้ชัดเจนในแง่สถิติ แต่หวังว่าตัวอย่างจะช่วยชี้แจง: สมมติว่ามีประชากรที่เชื่อมต่อกันสองคนคือและซึ่งในบางจุดสมาชิกของอาจ "เปลี่ยน" เป็นแต่กลับไม่ได้ ช่วงเวลาของการเปลี่ยนแปลงเป็นตัวแปร แต่ไม่ใช่แบบสุ่ม ตัวอย่างเช่นอาจเป็น "บุคคลที่ไม่มีลูกหลาน" และ "บุคคลที่มีลูกหลานอย่างน้อยหนึ่งคน" ฉันสนใจในอายุที่ความก้าวหน้านี้เกิดขึ้น แต่ฉันมีข้อมูลตัดขวางเท่านั้น สำหรับบุคคลใดก็ตามฉันสามารถค้นหาว่าพวกเขาเป็นสมาชิกของหรือหรือไม่ ฉันยังรู้อายุของบุคคลเหล่านี้ สำหรับแต่ละคนในประชากรB A B A B A B A BAAABBBAAABBBAAABBBAAABBBAAAฉันรู้ว่าอายุที่ผ่านการเปลี่ยนแปลงจะยิ่งใหญ่กว่าอายุปัจจุบันของพวกเขา ในทำนองเดียวกันสำหรับสมาชิกฉันรู้ว่าอายุการเปลี่ยนผ่านน้อยกว่าอายุปัจจุบันของพวกเขา แต่ฉันไม่รู้ค่าที่แน่นอนBBB ว่าฉันมีปัจจัยอื่นที่ฉันต้องการเปรียบเทียบกับอายุของการเปลี่ยนแปลง ตัวอย่างเช่นฉันต้องการทราบว่าชนิดย่อยของบุคคลหรือขนาดร่างกายมีผลต่ออายุของลูกหลานคนแรกหรือไม่ ฉันมีข้อมูลที่เป็นประโยชน์บางอย่างที่ควรแจ้งคำถามเหล่านั้น: โดยเฉลี่ยของบุคคลในบุคคลที่มีอายุมากกว่าจะได้รับการเปลี่ยนแปลงในภายหลัง แต่ข้อมูลไม่สมบูรณ์โดยเฉพาะอย่างยิ่งสำหรับคนอายุน้อยกว่า และในทางกลับกันสำหรับประชากรBBAAABBB มีวิธีการที่กำหนดขึ้นเพื่อจัดการกับข้อมูลประเภทนี้หรือไม่? ฉันไม่จำเป็นต้องใช้วิธีการอย่างเต็มรูปแบบในการวิเคราะห์เช่นนี้เพียงแค่ข้อความค้นหาหรือแหล่งข้อมูลที่มีประโยชน์เพื่อเริ่มฉันในที่ที่เหมาะสม! คำเตือน: ฉันทำสมมติฐานลดความซับซ้อนของการเปลี่ยนแปลงจากที่เพื่อเป็นทันที ฉันพร้อมที่จะสมมติว่าคนส่วนใหญ่จะก้าวหน้าไปที่จุดโดยสมมติว่าพวกเขามีชีวิตอยู่นานพอ และฉันรู้ว่าข้อมูลตามยาวจะมีประโยชน์มาก แต่สมมติว่าไม่มีในกรณีนี้B BAAABBBBBB ขอโทษถ้าสิ่งนี้ซ้ำซ้อนอย่างที่ฉันบอกไปส่วนหนึ่งของปัญหาของฉันคือฉันไม่รู้ว่าควรจะค้นหาอะไร ด้วยเหตุผลเดียวกันโปรดเพิ่มแท็กอื่น ๆ ตามความเหมาะสม ชุดตัวอย่าง: Ssp บ่งชี้ว่าหนึ่งในสองชนิดย่อยหรือYลูกหลานบ่งชี้ว่าไม่มีลูกหลาน ( ) …

2
เราจะหาความน่าจะเป็นที่ตัวแปรสุ่มสูงสุดได้อย่างไร
\newcommand{\P}{\mathbb{P}}สมมติว่าเรามีตัวแปรสุ่มอิสระ , ,ด้วยวิธีการ จำกัดและความแปรปรวน , , 2 ฉันกำลังมองหาขอบเขตการกระจายฟรีที่น่าจะเป็นที่ใดมีขนาดใหญ่กว่าอื่น ๆ ทั้งหมด ,ฉันNNNX1X1X_1……\ldotsXnXnX_nμ1≤…≤μNμ1≤…≤μN\mu_1 \leq \ldots \leq \mu_Nσ21σ12\sigma_1^2……\ldotsσ2NσN2\sigma_N^2Xi≠XNXi≠XNX_i \neq X_NXjXjX_jj≠ij≠ij \neq i กล่าวอีกนัยหนึ่งถ้าเพื่อความง่ายเราถือว่าการแจกแจงของนั้นต่อเนื่อง (เช่น ) ฉันกำลังมองหาขอบเขตบน: ถ้าเราสามารถใช้อสมการของ Chebyshev เพื่อรับ: \ P (X_1 = \ max_j X_j) = \ P (X_1> X_2) \ leq \ frac {\ sigma_1 ^ 2 + \ sigma_2 ^ …

4
อาจหมายถึงการบวกส่วนเบี่ยงเบนมาตรฐานหนึ่งค่าเกินค่าสูงสุดหรือไม่
ฉันมีค่าเฉลี่ย 74.10 และส่วนเบี่ยงเบนมาตรฐาน 33.44 สำหรับตัวอย่างที่มีค่าต่ำสุด 0 และสูงสุด 94.33 อาจารย์ของฉันถามฉันว่าค่าเฉลี่ยบวกหนึ่งส่วนเบี่ยงเบนมาตรฐานสูงกว่าค่าสูงสุดได้อย่างไร ฉันแสดงตัวอย่างมากมายเกี่ยวกับเรื่องนี้ แต่เธอไม่เข้าใจ ฉันต้องการการอ้างอิงเพื่อแสดงให้เธอเห็น อาจเป็นบทหรือย่อหน้าใด ๆ จากหนังสือสถิติที่พูดถึงเรื่องนี้โดยเฉพาะ

3
วิธีการสร้างแบบจำลองตัวแปรเป้าหมายที่ถูกผูกไว้?
ฉันมี 5 ตัวแปรและฉันพยายามที่จะทำนายตัวแปรเป้าหมายของฉันซึ่งจะต้องอยู่ในช่วง 0 ถึง 70 ฉันจะใช้ข้อมูลชิ้นนี้ในการสร้างแบบจำลองเป้าหมายได้ดีขึ้นได้อย่างไร

1
ขอบเขตบนของความหนาแน่นของโคคูล่า?
Fréchet-Hoeffding ผูกไว้บนใช้กับฟังก์ชั่นการกระจายเชื่อมและมันจะได้รับจาก C(u1,...,ud)≤min{u1,..,ud}.C(u1,...,ud)≤min{u1,..,ud}.C(u_1,...,u_d)\leq \min\{u_1,..,u_d\}. มีความคล้ายคลึงกัน (ในแง่ที่ว่ามันขึ้นอยู่กับความหนาแน่นของขอบ) สำหรับความหนาแน่นของแทนที่จะเป็น CDF หรือไม่?c(u1,...,ud)c(u1,...,ud)c(u_1,...,u_d) การอ้างอิงใด ๆ จะได้รับการชื่นชมอย่างมาก

6
การถดถอยเชิงเส้นเมื่อ Y ถูก จำกัด และไม่ต่อเนื่อง
คำถามตรงไปตรงมา: มันเหมาะสมที่จะใช้การถดถอยเชิงเส้นเมื่อ Y ถูก จำกัด และไม่ต่อเนื่อง (เช่นคะแนนทดสอบ 1 ~ 100, อันดับหนึ่งที่กำหนดไว้ล่วงหน้า 1 ~ 17)? ในกรณีนี้มันเป็น "ไม่ดี" ที่จะใช้การถดถอยเชิงเส้นหรือมันผิดทั้งหมดที่จะใช้หรือไม่

2
ความแปรปรวนของค่าสูงสุดของกลุ่มตัวอย่างคืออะไร?
ฉันกำลังหาขอบเขตของความแปรปรวนของตัวแปรสุ่มสูงสุดชุด กล่าวอีกนัยหนึ่งฉันกำลังมองหาสูตรปิดสำหรับเช่นนั้น ที่X = \ {X_1, \ ldots, X_M \}ได้รับการแก้ไข ชุดของMตัวแปรสุ่มด้วยวิธีการ จำกัด\ mu_1 \ ldots \ mu_Mและแปรปรวน\ sigma_1 ^ 2 \ ldots \ sigma_M ^ 2BBBVar(maxiXi)≤B,Var(maxiXi)≤B, \mbox{Var}(\max_i X_i) \leq B \enspace, X={X1,…,XM}X={X1,…,XM}X = \{ X_1, \ldots, X_M \}MMMμ1,…,μMμ1,…,μM\mu_1, \ldots, \mu_Mσ21,…,σ2Mσ12,…,σM2\sigma_1^2, \ldots, \sigma_M^2 ฉันสามารถสรุปได้ว่า Var(maxiXi)≤∑iσ2i,Var(maxiXi)≤∑iσi2, \mbox{Var}(\max_i X_i) \leq \sum_i \sigma_i^2 \enspace, …

1
จำนวนครั้งที่คาดว่าค่าเฉลี่ยเชิงประจักษ์จะเกินค่า
เมื่อพิจารณาลำดับของตัวแปรสุ่มของ iid ให้พูดว่าสำหรับฉันกำลังพยายามที่จะคาดเดาจำนวนครั้งที่ค่าเฉลี่ยเชิงประจักษ์จะเกินค่า, , ในขณะที่เรายังคงดึงตัวอย่างนั่นคือ: ฉัน= 1 , 2 , . . , n 1Xผม∈ [ 0 , 1 ]Xi∈[0,1]X_i \in [0,1]ฉัน= 1 , 2 , . . , ni=1,2,...,ni = 1,2,...,nc≥0T d e f = n ∑ j=1P({ 11nΣni = 1Xผม1n∑i=1nXi\frac{1}{n}\sum_{i=1}^n X_ic ≥ 0c≥0c \geq 0T=def∑j=1nP({1j∑i=1jXi≥c})T=def∑j=1nP({1j∑i=1jXi≥c}) \mathcal{T} \overset{def}{=} \sum_{j=1}^n …

2
ขอบเขตท้ายของ Euclidean norm สำหรับการกระจายแบบสม่ำเสมอบน
สิ่งที่เป็นที่รู้กันว่าขอบเขตบนของยุคลิดเป็นองค์ประกอบที่ได้รับการแต่งตั้งอย่างสม่ำเสมอของจะใหญ่กว่าเกณฑ์ที่กำหนดหรือไม่{−n, −(n−1), ..., n−1, n}d{−n, −(n−1), ..., n−1, n}d\:\{-n,~-(n-1),~...,~n-1,~n\}^d\: ฉันสนใจส่วนใหญ่อยู่ในขอบเขตที่มาบรรจบกันชี้แจงให้เป็นศูนย์เมื่อnnnมีมากน้อยกว่าdddd

1
การจัดการกับการถดถอยของตัวแปรตอบสนองที่มีขอบเขตผิดปกติ
ฉันกำลังพยายามที่จะสร้างแบบจำลองตัวแปรการตอบสนองที่ถูกผูกไว้ในทางทฤษฎีระหว่าง -225 และ +225 ตัวแปรคือคะแนนรวมที่ผู้เล่นได้รับเมื่อเล่นเกม แม้ว่าในทางทฤษฎีมันเป็นไปได้สำหรับวิชาที่จะทำคะแนน +225 แม้จะเป็นเช่นนี้เพราะคะแนนขึ้นอยู่กับการกระทำของอาสาสมัครเท่านั้น แต่ยังรวมถึงการกระทำของการกระทำอื่นที่คะแนนสูงสุดที่ทุกคนทำคือ 125 (นี่คือผู้เล่นสูงสุด 2 คนที่เล่นกันสามารถทำคะแนนได้) เกิดขึ้นด้วยความถี่สูงมาก คะแนนต่ำสุดคือ +35 ขอบเขตของ 125 นี้ทำให้เกิดปัญหากับการถดถอยเชิงเส้น สิ่งเดียวที่ฉันคิดได้คือการปรับขนาดการตอบสนองใหม่ให้อยู่ระหว่าง 0 ถึง 1 และใช้การถดถอยเบต้า ถ้าฉันทำเช่นนี้แม้ว่าฉันไม่แน่ใจว่าฉันสามารถพิสูจน์ได้ว่า 125 เป็นขอบเขตสูงสุด (หรือ 1 หลังจากการเปลี่ยนแปลง) เนื่องจากเป็นไปได้ที่จะได้คะแนน +225 นอกจากนี้ถ้าฉันทำสิ่งนี้ขอบเขตด้านล่างของฉันคือ 35 ขอบคุณ โจนาธาน

2
การทดสอบสมมติฐานและระยะทางรวมทั้งหมดกับ Kullback-Leibler divergence
ในการวิจัยของฉันฉันพบปัญหาทั่วไปต่อไปนี้: ฉันมีการแจกแจงและครั้งในโดเมนเดียวกันและมีตัวอย่างจำนวนมาก (แต่ จำกัด ) จากการแจกแจงเหล่านั้น ตัวอย่างมีการกระจายอย่างเป็นอิสระและเหมือนกันจากหนึ่งในสองการแจกแจง (แม้ว่าการแจกแจงอาจเกี่ยวข้อง: ตัวอย่างเช่นQอาจเป็นส่วนผสมของPและการกระจายอื่น ๆ ) สมมติฐานว่างเปล่าคือตัวอย่างมาจากPสมมุติฐานสำรองคือ ตัวอย่างมาจากQPPPQQQQQQPPPPPPQQQ ฉันพยายามที่จะอธิบายลักษณะ Type I และ Type II ข้อผิดพลาดในการทดสอบตัวอย่างที่รู้กระจายPPPและQQQQโดยเฉพาะอย่างยิ่งผมสนใจในขอบเขตหนึ่งข้อผิดพลาดที่กำหนดอื่น ๆ นอกเหนือไปจากความรู้ของPPPและQQQQ ฉันได้ถามคำถามทางคณิตศาสตร์เกี่ยวกับความสัมพันธ์ของระยะทางรวมการเปลี่ยนแปลงระหว่างPPPและQQQกับการทดสอบสมมติฐานและได้รับคำตอบที่ฉันยอมรับ คำตอบนั้นสมเหตุสมผล แต่ฉันยังไม่สามารถสรุปความหมายที่ลึกกว่าความสัมพันธ์ของระยะทางรวมของการเปลี่ยนแปลงและการทดสอบสมมติฐานที่เกี่ยวข้องกับปัญหาของฉัน ดังนั้นฉันตัดสินใจที่จะเปิดฟอรั่มนี้ คำถามแรกของฉันคือ: ความผันแปรทั้งหมดนั้นรวมกับผลรวมของความน่าจะเป็นของข้อผิดพลาด Type I และ Type II ที่เป็นอิสระจากวิธีการทดสอบสมมติฐานที่มีอยู่หรือไม่ ในสาระสำคัญตราบใดที่มีความน่าจะเป็นที่ไม่ใช่ศูนย์ที่ตัวอย่างอาจถูกสร้างขึ้นโดยการแจกแจงอย่างใดอย่างหนึ่งความน่าจะเป็นที่มีข้อผิดพลาดอย่างน้อยหนึ่งข้อต้องไม่เป็นศูนย์ โดยพื้นฐานแล้วคุณไม่สามารถหลบหนีความเป็นไปได้ที่ผู้ทดสอบสมมติฐานของคุณจะทำผิดพลาดไม่ว่าคุณจะประมวลผลสัญญาณมากแค่ไหน และขอบเขตความแปรปรวนโดยรวมที่เป็นไปได้แน่นอน ความเข้าใจของฉันถูกต้องหรือไม่ นอกจากนี้ยังมีความสัมพันธ์ระหว่าง Type I และข้อผิดพลาดครั้งที่สองและพื้นฐานแจกแจงความน่าจะอีกและคือKL แตกต่าง ดังนั้นคำถามที่สองของฉันคือ: KL-divergence ผูกมัดใช้ได้กับวิธีการทดสอบสมมติฐานเฉพาะวิธีเดียวเท่านั้น (ดูเหมือนว่าจะเกิดขึ้นรอบ ๆ วิธีอัตราส่วนความน่าจะเป็นในการเข้าสู่ระบบมาก) หรือหนึ่งสามารถใช้ได้กับวิธีการทดสอบสมมติฐานทั้งหมด …

1
ขอบเขตของความแตกต่างของตัวแปรสุ่มที่สัมพันธ์กัน
ด้วยตัวแปรสุ่มที่มีความสัมพันธ์สูงสองตัวและฉันต้องการที่จะจำกัดความน่าจะเป็นที่ความแตกต่างเกินจำนวนที่กำหนด: XXXYYY|X−Y||X−Y| |X - Y| P(|X−Y|&gt;K)&lt;δP(|X−Y|&gt;K)&lt;δ P( |X - Y| > K) < \delta สมมติว่าความเรียบง่ายนั้น: สัมประสิทธิ์สหสัมพันธ์เป็นที่รู้กันว่า "สูง" พูดว่า: ρX,Y=covar(X,Y)/σXσY≥1−ϵρX,Y=covar(X,Y)/σXσY≥1−ϵ \rho_{X,Y}= {covar(X,Y)} / {\sigma_X \sigma_Y} \geq 1 - \epsilon X,YX,YX,Y มีค่าเฉลี่ยเป็นศูนย์:μx=μy=0μx=μy=0 \mu_x = \mu_y = 0 −1≤xi,yi≤1−1≤xi,yi≤1-1 \leq x_i, y_i \leq 1 (หรือ ถ้ามันง่ายกว่า)0≤xi,yi≤10≤xi,yi≤1 0 \leq x_i, y_i \leq 1 (ถ้าทำให้สิ่งต่าง …

3
วิธีการพิสูจน์ว่า
ฉันพยายามสร้างความไม่เท่าเทียมกัน |Ti|=∣∣Xi−X¯∣∣S≤n−1n−−√|Ti|=|Xi−X¯|S≤n−1n\left| T_i \right|=\frac{\left|X_i -\bar{X} \right|}{S} \leq\frac{n-1}{\sqrt{n}} โดยที่คือค่าเฉลี่ยตัวอย่างและเป็นส่วนเบี่ยงเบนมาตรฐานตัวอย่างนั่นคือ {n-1}}X¯X¯\bar{X}SSSS=∑ni=1(Xi−X¯)2n−1−−−−−−−−−√S=∑i=1n(Xi−X¯)2n−1S=\sqrt{\frac{\sum_{i=1}^n \left( X_i -\bar{X} \right)^2}{n-1}} มันง่ายที่จะเห็นว่าและแต่สิ่งนี้ไม่ใกล้เคียงกับสิ่งที่ฉันค้นหามามากและมันก็ไม่มีประโยชน์ ฉันได้ทดลองกับ Cauchy-Schwarz และความไม่เท่าเทียมกันของรูปสามเหลี่ยม แต่ไม่มีที่ไหนเลย จะต้องมีขั้นตอนที่บอบบางที่ฉันหายไปที่ไหนสักแห่ง ฉันขอขอบคุณความช่วยเหลือบางส่วนขอบคุณ∑ni=1T2i=n−1∑i=1nTi2=n−1\sum_{i=1}^n T_i^2 = n-1 |Ti|&lt;n−1−−−−−√|Ti|&lt;n−1\left| T_i \right| < \sqrt{n-1}

2
ผลการถดถอยมีขอบเขตบนที่ไม่คาดคิด
ฉันพยายามทำนายคะแนนสมดุลและลองวิธีการถดถอยที่แตกต่างกันหลายวิธี สิ่งหนึ่งที่ฉันสังเกตเห็นคือค่าคาดการณ์ดูเหมือนจะมีขอบเขตบนบางอย่าง นั่นคือความสมดุลที่เกิดขึ้นจริงในแต่คาดการณ์ของฉันที่ด้านบนสุดที่ประมาณ0.8พล็อตต่อไปนี้แสดงยอดคงเหลือตามจริงกับยอดคงเหลือที่คาดการณ์ไว้ (ทำนายด้วยการถดถอยเชิงเส้น):[ 0.0 , 1.0 )[0.0,1.0)[0.0, 1.0)0.80.80.8 และนี่คือแผนการแจกแจงสองข้อมูลเดียวกัน: เนื่องจากตัวทำนายของฉันเบ้มาก (ข้อมูลผู้ใช้ที่มีการแจกแจงกฎหมายพลังงาน) ฉันจึงใช้การแปลงแบบบ็อกซ์ค็อกซ์ซึ่งเปลี่ยนผลลัพธ์เป็นต่อไปนี้: แม้ว่ามันจะเปลี่ยนการกระจายตัวของการทำนาย แต่ก็ยังคงมีขอบเขตบน ดังนั้นคำถามของฉันคือ: อะไรคือเหตุผลที่เป็นไปได้สำหรับขอบเขตบนดังกล่าวในผลการทำนาย? ฉันจะแก้ไขการคาดการณ์เพื่อให้สอดคล้องกับการแจกแจงของค่าจริงได้อย่างไร โบนัส:เนื่องจากการกระจายหลังจากแปลงบ็อกซ์ค็อกซ์ดูเหมือนว่าจะเป็นไปตามการกระจายตัวของตัวทำนายที่ถูกแปลงเป็นไปได้หรือไม่ว่ามันเชื่อมโยงโดยตรงหรือไม่ ถ้าเป็นเช่นนั้นจะมีการเปลี่ยนแปลงที่ฉันสามารถนำไปใช้เพื่อให้เหมาะสมกับการกระจายตัวกับค่าจริงหรือไม่? แก้ไข:ฉันใช้การถดถอยเชิงเส้นอย่างง่ายพร้อมตัวทำนาย 5 ตัว
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.