คำถามติดแท็ก variance

ความเบี่ยงเบนกำลังสองของตัวแปรสุ่มที่คาดหวังจากค่าเฉลี่ย หรือค่าเบี่ยงเบนยกกำลังสองเฉลี่ยของข้อมูลเกี่ยวกับค่าเฉลี่ย

2
เหตุใดการวินิจฉัยจากการทดสอบทรงกลมของ Bartlett จึงหมายความว่า PCA ไม่เหมาะสม
ฉันเข้าใจว่าการทดสอบของ Bartlett เกี่ยวข้องกับการพิจารณาว่าตัวอย่างของคุณมาจากประชากรที่มีความแปรปรวนเท่ากันหรือไม่ หากตัวอย่างนั้นมาจากประชากรที่มีความแปรปรวนเท่ากันเราจะไม่ปฏิเสธสมมติฐานว่างของการทดสอบดังนั้นการวิเคราะห์องค์ประกอบหลักนั้นไม่เหมาะสม ฉันไม่แน่ใจว่าปัญหาของสถานการณ์นี้อยู่ที่ใด (มีชุดข้อมูลแบบ homoskedastic) อยู่ มีปัญหาอะไรกับการมีชุดข้อมูลที่การกระจายของข้อมูลทั้งหมดของคุณเหมือนกัน? ฉันไม่เห็นเรื่องใหญ่ถ้าเงื่อนไขนี้มีอยู่ เหตุใดจึงทำให้ PCA ไม่เหมาะสม ฉันไม่สามารถหาข้อมูลที่ดีได้ทุกที่ทางออนไลน์ ใครบ้างมีประสบการณ์ในการตีความว่าเพราะเหตุใดการทดสอบนี้จึงเกี่ยวข้องกับ PCA

3
คำนวณความแปรปรวนที่อธิบายโดยตัวทำนายแต่ละตัวในการถดถอยหลายครั้งโดยใช้ R
ฉันใช้การถดถอยหลายครั้งซึ่งโมเดลโดยรวมมีความสำคัญและอธิบายความแปรปรวนประมาณ 13% อย่างไรก็ตามฉันต้องการค้นหาจำนวนความแปรปรวนที่อธิบายโดยตัวทำนายสำคัญแต่ละตัว ฉันจะทำสิ่งนี้โดยใช้ R ได้อย่างไร นี่คือตัวอย่างข้อมูลและรหัส: D = data.frame( dv = c( 0.75, 1.00, 1.00, 0.75, 0.50, 0.75, 1.00, 1.00, 0.75, 0.50 ), iv1 = c( 0.75, 1.00, 1.00, 0.75, 0.75, 1.00, 0.50, 0.50, 0.75, 0.25 ), iv2 = c( 0.882, 0.867, 0.900, 0.333, 0.875, 0.500, 0.882, 0.875, 0.778, …
14 r  regression  variance 

3
การวัดทางสถิติหากภาพประกอบด้วยพื้นที่ที่เชื่อมต่อกันเป็นอวกาศ
ลองพิจารณาภาพระดับสีเทาทั้งสองนี้: ภาพแรกแสดงรูปแบบแม่น้ำที่คดเคี้ยว ภาพที่สองแสดงสัญญาณรบกวนแบบสุ่ม ฉันกำลังมองหาการวัดทางสถิติที่ฉันสามารถใช้เพื่อตรวจสอบว่าเป็นไปได้หรือไม่ที่ภาพแสดงรูปแบบของแม่น้ำ ภาพแม่น้ำมีสองพื้นที่: แม่น้ำ = ค่าสูงและอื่น ๆ = ค่าต่ำ ผลลัพธ์คือฮิสโตแกรมนั้นมีค่า bimodal: ดังนั้นรูปภาพที่มีลวดลายของแม่น้ำควรมีความแปรปรวนสูง อย่างไรก็ตามภาพสุ่มด้านบน: River_var = 0.0269, Random_var = 0.0310 ในทางตรงกันข้ามภาพสุ่มมีความต่อเนื่องของพื้นที่ต่ำในขณะที่ภาพแม่น้ำมีความต่อเนื่องของพื้นที่สูงซึ่งแสดงให้เห็นอย่างชัดเจนในรูปแบบการทดลองที่หลากหลาย: ในทำนองเดียวกันความแปรปรวน "สรุป" ฮิสโตแกรมในตัวเลขหนึ่งฉันกำลังมองหาตัวชี้วัดเชิงพื้นที่ที่ "สรุป" ตัวแปรทดลอง ฉันต้องการให้มาตรการนี้ "ลงโทษ" ความผันแปรสูงที่ความล่าช้าเล็ก ๆ หนักกว่าความล่าช้าใหญ่ดังนั้นฉันจึงได้คิด: s v a r = ∑nh = 1γ( h ) / h2 svar=∑h=1nγ(h)/h2\ svar = \sum_{h=1}^n \gamma(h)/h^2 ถ้าฉันเพิ่มจาก …

2
การเริ่มต้นน้ำหนักของ CNN ซาเวียร์
ในบทช่วยสอนบางอย่างฉันพบว่ามีการระบุว่าการเริ่มต้นน้ำหนัก "ซาเวียร์" (กระดาษ: การทำความเข้าใจกับความยากลำบากในการฝึกอบรมเครือข่ายนิวรัล feedforward ลึก ) เป็นวิธีที่มีประสิทธิภาพในการเริ่มต้นน้ำหนักของเครือข่ายประสาท สำหรับเลเยอร์ที่เชื่อมต่ออย่างสมบูรณ์มีกฎง่ายๆในบทเรียนเหล่านี้: Var(W)=2nin+nout,simpler alternative:Var(W)=1ninVar(W)=2nin+nout,simpler alternative:Var(W)=1ninVar(W) = \frac{2}{n_{in} + n_{out}}, \quad \text{simpler alternative:} \quad Var(W) = \frac{1}{n_{in}} โดยที่คือความแปรปรวนของตุ้มน้ำหนักสำหรับเลเยอร์เริ่มต้นด้วยการแจกแจงแบบปกติและ ,คือจำนวนของเซลล์ประสาทในพาเรนต์และในเลเยอร์ปัจจุบันVar(W)Var(W)Var(W)ninninn_{in}noutnoutn_{out} มีกฎของหัวแม่มือคล้ายกันสำหรับเลเยอร์ convolutional? ฉันกำลังดิ้นรนเพื่อหาว่าอะไรจะดีที่สุดในการเริ่มต้นน้ำหนักของชั้น convolutional เช่นในเลเยอร์ที่มีรูปร่างของน้ำหนัก(5, 5, 3, 8)ดังนั้นขนาดเคอร์เนลคือการ5x5กรองสามช่องสัญญาณ (อินพุต RGB) และการสร้าง8แผนที่คุณลักษณะ ... จะถูก3พิจารณาว่าเป็นจำนวนเซลล์ประสาทอินพุตหรือไม่ หรือมากกว่า75 = 5*5*3เพราะอินพุตเป็น5x5แพตช์สำหรับแต่ละช่องสี ฉันจะยอมรับทั้งสองคำตอบที่เฉพาะเจาะจงเพื่อชี้แจงปัญหาหรือคำตอบ "ทั่วไป" มากกว่านี้เพื่ออธิบายกระบวนการทั่วไปของการค้นหาน้ำหนักเริ่มต้นที่ถูกต้องและการเชื่อมโยงแหล่งที่มาโดยเฉพาะ

2
overdispersion ในการถดถอยโลจิสติก
ฉันพยายามจัดการกับแนวคิดของการกระจายเกินเหตุในการถดถอยโลจิสติก ฉันได้อ่านว่าการกระจายข้อความเกินขนาดนั้นเกิดขึ้นเมื่อความแปรปรวนที่สังเกตได้ของตัวแปรตอบกลับสูงกว่าที่คาดไว้จากการแจกแจงทวินาม แต่หากตัวแปรทวินามมีได้เพียงสองค่า (1/0) จะมีค่าเฉลี่ยและความแปรปรวนได้อย่างไร ฉันสบายดีกับการคำนวณค่าเฉลี่ยและความแปรปรวนของความสำเร็จจากการทดลองหมายเลข Bernoulli แต่ฉันไม่สามารถคาดเดาแนวคิดเรื่องค่าเฉลี่ยและความแปรปรวนของตัวแปรที่มีค่าได้สองค่าเท่านั้น ทุกคนสามารถให้ภาพรวมที่ใช้งานง่ายของ: แนวคิดของค่าเฉลี่ยและความแปรปรวนในตัวแปรที่สามารถมีได้สองค่าเท่านั้น แนวคิดของการกระจายเกินเหตุในตัวแปรที่มีได้เพียงสองค่า

2
ฉันไม่เข้าใจความแปรปรวนของทวินาม
ฉันรู้สึกงี่เง่าจริงๆแม้จะถามคำถามพื้นฐาน แต่นี่ไป: ถ้าฉันมีตัวแปรสุ่มที่สามารถรับค่าและด้วยและดังนั้นถ้าฉันดึงตัวอย่างออกมาฉันจะได้ การกระจายแบบทวินามXXX000111P(X=1)=pP(X=1)=pP(X=1) = pP(X=0)=1−pP(X=0)=1−pP(X=0) = 1-pnnn ค่าเฉลี่ยของการแจกแจงคือ μ=np=E(X)μ=np=E(X)\mu = np = E(X) ความแปรปรวนของการแจกแจงคือ σ2=np(1−p)σ2=np(1−p)\sigma^2 = np(1-p) นี่คือที่ปัญหาของฉันเริ่มต้น: ความแปรปรวนจะถูกกำหนดโดย 2 เนื่องจากสแควร์ของผลลัพธ์เป็นไปได้สองรายการไม่เปลี่ยนแปลงอะไรเลย (และ ) นั่นหมายถึงดังนั้นนั่นหมายถึงσ2=E(X2)−E(X)2σ2=E(X2)−E(X)2\sigma^2 = E(X^2) - E(X)^2XXX02=002=00^2 = 012=112=11^2 = 1E(X2)=E(X)E(X2)=E(X)E(X^2) = E(X) σ2=E(X2)−E(X)2=E(X)−E(X)2=np−n2p2=np(1−np)≠np(1−p)σ2=E(X2)−E(X)2=E(X)−E(X)2=np−n2p2=np(1−np)≠np(1−p)\sigma^2 = E(X^2) - E(X)^2 = E(X) - E(X)^2 = np - n^2p^2 = np(1-np) …

1
การย่อยสลายความแปรปรวนแบบอคติ
ในส่วนที่ 3.2 ของการจดจำรูปแบบของอธิการและการเรียนรู้ของเครื่องจักรเขากล่าวถึงการสลายตัวของความแปรปรวนแบบอคติโดยระบุว่าสำหรับฟังก์ชันการสูญเสียกำลังสองการสูญเสียที่คาดหวังสามารถแยกย่อยเป็นระยะอคติกำลังสอง (ซึ่งอธิบายว่า รุ่น), คำแปรปรวน (ซึ่งอธิบายการแพร่กระจายของการทำนายรอบค่าเฉลี่ย) และคำที่มีเสียงรบกวน (ซึ่งให้เสียงที่แท้จริงของข้อมูล) สามารถทำการไบอัส - แปรปรวนการสลายตัวด้วยฟังก์ชั่นการสูญเสียอื่น ๆ นอกเหนือจากการสูญเสียกำลังสอง? สำหรับชุดข้อมูลโมเดลที่กำหนดมีมากกว่าหนึ่งโมเดลที่มีการสูญเสียที่คาดว่าจะต่ำกว่าทุกโมเดลและถ้าเป็นเช่นนั้นนั่นหมายความว่าอาจมีการผสมผสานระหว่างอคติและความแปรปรวนต่างกัน หากแบบจำลองเกี่ยวข้องกับการทำให้เป็นมาตรฐานจะมีความสัมพันธ์ทางคณิตศาสตร์ระหว่างอคติความแปรปรวนและสัมประสิทธิ์การทำให้เป็นมาตรฐานหรือไม่?λλ\lambda คุณจะคำนวณอคติได้อย่างไรถ้าคุณไม่รู้รูปแบบที่แท้จริง? มีสถานการณ์ที่เหมาะสมหรือไม่ที่จะลดอคติหรือความแปรปรวนมากกว่าการสูญเสียที่คาดหวังไว้ (ผลรวมของความเอนเอียงและความแปรปรวนกำลังสอง)

1
ความแปรปรวนในระยะยาวคืออะไร?
ความแปรปรวนในระยะยาวในขอบเขตของการวิเคราะห์อนุกรมเวลาได้กำหนดไว้อย่างไร ฉันเข้าใจว่ามันถูกใช้ในกรณีที่มีโครงสร้างความสัมพันธ์ในข้อมูล ดังนั้นกระบวนการสโตแคสติกของเราจะไม่เป็นตระกูลX1,X2…X1,X2…X_1, X_2 \dots iid ตัวแปรสุ่ม แต่เป็นการกระจายตัวเท่านั้น ฉันขออ้างอิงมาตรฐานเพื่อแนะนำแนวคิดและปัญหาที่เกี่ยวข้องกับการประมาณค่าได้ไหม

3
ต้องมีคุณสมบัติตรงตามเกณฑ์ใดบ้างเพื่อสรุปว่า 'เอฟเฟกต์ฝ้า' เกิดขึ้นได้อย่างไร
ตามสารานุกรม SAGE ของวิธีการวิจัยทางสังคมศาสตร์ ... [a] เอฟเฟ็กต์เพดานเกิดขึ้นเมื่อการวัดมีขีด จำกัด สูงสุดที่ชัดเจนสำหรับการตอบสนองที่อาจเกิดขึ้นและความเข้มข้นของผู้เข้าร่วมจำนวนมากจะทำคะแนนที่หรือใกล้เคียงกับขีด จำกัด นี้ การลดทอนขนาดเป็นปัญหาที่เกิดขึ้นเมื่อใดก็ตามที่มีข้อ จำกัด ในลักษณะนี้ ... ตัวอย่างเช่นผลกระทบเพดานอาจเกิดขึ้นกับการวัดทัศนคติซึ่งคะแนนสูงบ่งบอกถึงทัศนคติที่ดีและการตอบสนองสูงสุดไม่สามารถประเมินผลในเชิงบวกได้มากที่สุด ... ทางออกที่ดีที่สุดในการแก้ไขปัญหาของผลกระทบเพดานคือการทดสอบนำร่องซึ่งจะช่วยให้ปัญหาที่จะระบุในช่วงต้น หากพบเอฟเฟกต์เพดาน[และ] การวัดผลลัพธ์คือประสิทธิภาพของงานงานนั้นสามารถทำได้ยากขึ้นเพื่อเพิ่มช่วงของการตอบสนองที่เป็นไปได้ 1 [เน้นเพิ่ม] ดูเหมือนว่าจะมีจำนวนมากของคำแนะนำและคำถาม ( และที่นี่ ) การจัดการกับข้อมูลการวิเคราะห์ซึ่งแสดงให้เห็นผลกระทบเพดานคล้ายกับที่อธิบายไว้ในใบเสนอราคาดังกล่าวข้างต้น คำถามของฉันอาจเรียบง่ายหรือไร้เดียงสา แต่ใครจะตรวจพบว่ามีเอฟเฟกต์เพดานติดอยู่ในข้อมูลได้อย่างไร กล่าวโดยเฉพาะว่าการทดสอบทางไซโครเมทถูกสร้างขึ้นและสงสัยว่าจะนำไปสู่เอฟเฟกต์เพดาน (การตรวจด้วยสายตาเท่านั้น) จากนั้นการทดสอบนั้นจะได้รับการแก้ไขเพื่อให้ได้ค่าที่มากขึ้น จะแสดงให้เห็นอย่างไรว่าการทดสอบที่ปรับปรุงแล้วได้ลบผลกระทบบนเพดานออกจากข้อมูลที่สร้างขึ้น? มีการทดสอบซึ่งแสดงให้เห็นว่ามีผลกระทบเพดานในชุดข้อมูลแต่ไม่มีผลกระทบเพดานในชุดข้อมูลข ? วิธีการที่ไร้เดียงสาของฉันคือการตรวจสอบการกระจายเบ้และถ้ามันไม่เบ้สรุปได้ว่าไม่มีเอฟเฟกต์เพดาน มันง่ายเกินไปใช่ไหม? แก้ไข หากต้องการเพิ่มตัวอย่างที่เป็นรูปธรรมมากขึ้นฉันพูดว่าฉันพัฒนาเครื่องมือที่ใช้วัดคุณลักษณะแฝงxซึ่งเพิ่มขึ้นตามอายุ แต่ในที่สุดก็ถึงระดับและเริ่มลดลงเมื่ออายุมากขึ้น ฉันสร้างเวอร์ชันแรกซึ่งมีช่วง 1-14 ทำการนำร่องบางส่วนและพบว่าดูเหมือนว่าอาจมีเอฟเฟกต์เพดาน (จำนวนการตอบสนองที่มากหรือใกล้ 14 มากที่สุด .. ฉันสรุปได้เพียงแค่โดย ดูข้อมูล แต่ทำไมมีวิธีใดที่เข้มงวดในการสนับสนุนการอ้างสิทธิ์นั้น จากนั้นฉันทบทวนการวัดเพื่อให้มีช่วง …

2
รู้จัก Var (X), วิธีคำนวณ Var (1 / X)?
หากฉันมีเพียงฉันจะคำนวณอย่างไรV a r ( 1)Var(X)Var(X)\mathrm{Var}(X)Var(1X)Var(1X)\mathrm{Var}(\frac{1}{X}) ฉันไม่ได้มีข้อมูลใด ๆ เกี่ยวกับการกระจายของดังนั้นผมจึงไม่สามารถใช้การเปลี่ยนแปลงหรือวิธีการอื่นใดที่ใช้น่าจะเป็นของการกระจายXXXXXXX

1
ค่าที่คาดหวังและความแปรปรวนของฟังก์ชันติดตาม
สำหรับตัวแปรสุ่มและเมทริกซ์กึ่งบวกแน่นอนA : มีการแสดงออกที่ง่ายสำหรับค่าที่คาดไว้\ mathop {\ mathbb E} [Tr (X ^ TAX)]และความแปรปรวน , Var [Tr (X ^ TAX)] ? โปรดทราบว่าAไม่ใช่ตัวแปรสุ่ม A E [ T r ( X T A X ) ] V a r [ T r ( X T A X ) ] AX∈RhX∈RhX \in \mathbb{R}^hAAAE[Tr(XTAX)]E⁡[Tr(XTAX)]\mathop {\mathbb E}[Tr(X^TAX)]Var[Tr(XTAX)]Var[Tr(XTAX)]Var[Tr(X^TAX)]AAA

2
ความแปรปรวนของค่าสูงสุดของกลุ่มตัวอย่างคืออะไร?
ฉันกำลังหาขอบเขตของความแปรปรวนของตัวแปรสุ่มสูงสุดชุด กล่าวอีกนัยหนึ่งฉันกำลังมองหาสูตรปิดสำหรับเช่นนั้น ที่X = \ {X_1, \ ldots, X_M \}ได้รับการแก้ไข ชุดของMตัวแปรสุ่มด้วยวิธีการ จำกัด\ mu_1 \ ldots \ mu_Mและแปรปรวน\ sigma_1 ^ 2 \ ldots \ sigma_M ^ 2BBBVar(maxiXi)≤B,Var(maxiXi)≤B, \mbox{Var}(\max_i X_i) \leq B \enspace, X={X1,…,XM}X={X1,…,XM}X = \{ X_1, \ldots, X_M \}MMMμ1,…,μMμ1,…,μM\mu_1, \ldots, \mu_Mσ21,…,σ2Mσ12,…,σM2\sigma_1^2, \ldots, \sigma_M^2 ฉันสามารถสรุปได้ว่า Var(maxiXi)≤∑iσ2i,Var(maxiXi)≤∑iσi2, \mbox{Var}(\max_i X_i) \leq \sum_i \sigma_i^2 \enspace, …

4
การประยุกต์ใช้ความแปรปรวนในทางปฏิบัติคืออะไร?
ฉันกำลังสอนทฤษฎีความน่าจะเป็นของตัวเองและฉันไม่แน่ใจว่าฉันเข้าใจการใช้ความแปรปรวนใด ๆ ซึ่งตรงข้ามกับการเบี่ยงเบนมาตรฐาน ในสถานการณ์ฝึกที่ฉันกำลังดูความแปรปรวนมีขนาดใหญ่กว่าช่วงดังนั้นจึงไม่มีประโยชน์อย่างสังหรณ์ใจ
13 variance 

3
ความน่าจะเป็นที่การแจกแจงแบบปกติที่มีความแปรปรวนแบบไม่สิ้นสุดมีค่ามากกว่าค่าเฉลี่ยของมันคืออะไร
วันนี้ฉันถูกถามอะไรทำนองนี้ ผู้สัมภาษณ์ต้องการที่จะรู้ว่าความเป็นไปได้ที่ตัวเลือกเงินจะสิ้นสุดที่เงินเมื่อความผันผวนมีแนวโน้มที่จะไม่มีที่สิ้นสุด ฉันบอกว่า 0% เพราะการแจกแจงแบบปกติที่อยู่ภายใต้โมเดล Black-Scholes และสมมติฐานการเดินสุ่มจะมีความแปรปรวนไม่สิ้นสุด แล้วผมก็หาความน่าจะเป็นของค่าทั้งหมดจะเป็นศูนย์ ผู้สัมภาษณ์ของฉันบอกว่าคำตอบที่ถูกคือ 50% เพราะการแจกแจงแบบปกติจะยังคงสมมาตรและเกือบจะเหมือนกัน ดังนั้นเมื่อคุณรวมจากค่าเฉลี่ยถึง + อินฟินิตี้คุณจะได้รับ 50% ฉันยังไม่มั่นใจกับเหตุผลของเขา ถูกต้องใคร

2
การอธิบายความแปรปรวนของตัวแบบการถดถอย
นี่อาจเป็นคำอธิบายง่ายๆ (ฉันหวังอยู่แล้ว) ฉันได้ทำการวิเคราะห์การถดถอยใน Matlab โดยใช้กล่องเครื่องมือการถดถอย อย่างไรก็ตามฉันได้เจอการศึกษาที่ระบุสิ่งนี้: "การใช้การวิเคราะห์การถดถอยมันเป็นไปได้ที่จะสร้างแบบจำลองการทำนายโดยใช้คุณสมบัติสี่เสียงที่อธิบายความแปรปรวน 60%" ลิงก์ไปยังบทความอยู่ที่นี่หากจำเป็น: บทความ ฉันไม่แน่ใจ 100% ว่านี่หมายถึงอะไร แต่ฉันหวังว่ามันจะง่าย 60% ก็เป็นสิ่งที่ดีเช่นกัน? ฉันพยายามค้นหาสิ่งนี้ แต่เนื่องจากมีเปอร์เซ็นต์ก่อนคำว่า 'ความแปรปรวน' เสมอจึงเป็นการยากที่จะหาคำตอบ
13 variance 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.