คำถามติดแท็ก ratio

ความสัมพันธ์เชิงปริมาณระหว่างจำนวนสองจำนวนที่แสดงจำนวนครั้งที่ค่าหนึ่งมีหรือมีอยู่ภายในอีกค่าหนึ่ง ผลหารทางคณิตศาสตร์ของจำนวนหนึ่งโดยจำนวนอื่น

15
จำนวนที่คาดหวังอัตราส่วนของการเกิดหญิงกับชาย
ฉันเจอคำถามหนึ่งในการสัมภาษณ์งานการทดสอบความถนัดเรื่องการคิดอย่างมีวิจารณญาณ มันเป็นอะไรแบบนี้ สาธารณรัฐ Zorganian มีประเพณีแปลก ๆ คู่รักมีความประสงค์ที่จะมีลูกผู้หญิงเท่านั้นเพราะผู้หญิงเท่านั้นที่สามารถสืบทอดทรัพย์สมบัติของครอบครัวได้ดังนั้นหากพวกเขามีลูกผู้ชายพวกเขาจะมีลูกเพิ่มขึ้นเรื่อย ๆ จนกว่าพวกเขาจะมีผู้หญิง หากพวกเขามีผู้หญิงพวกเขาหยุดมีลูก อัตราส่วนระหว่างเด็กหญิงกับชายใน Zorgania คือเท่าไหร่? ฉันไม่เห็นด้วยกับคำตอบแบบจำลองที่กำหนดโดยผู้เขียนคำถามซึ่งมีประมาณ 1: 1 เหตุผลก็คือการเกิดใด ๆ จะมีโอกาส 50% ในการเป็นชายหรือหญิง คุณช่วยโน้มน้าวฉันด้วยคำตอบที่แข็งแกร่งทางคณิตศาสตร์ของถ้าคือจำนวนของเด็กหญิงและ B คือจำนวนเด็กชายในประเทศ?GE [ G ] : E [ B ]E[G]:E[B]\text{E}[G]:\text{E}[B]GGG

2
ฉันได้ยินมาว่าอัตราส่วนหรือผกผันของตัวแปรสุ่มมักเป็นปัญหาโดยไม่คาดหวัง ทำไมถึงเป็นอย่างนั้น?
ชื่อเป็นคำถาม ฉันได้รับการบอกว่าอัตราส่วนและผู้แปรผันของตัวแปรสุ่มมักเป็นปัญหา สิ่งที่มีความหมายคือความคาดหวังนั้นมักจะไม่มีอยู่จริง มีคำอธิบายทั่วไปอย่างง่าย ๆ หรือไม่?

1
ตัวประมาณค่าที่เป็นอิสระของอัตราส่วนของสัมประสิทธิ์การถดถอยสองตัว?
สมมติว่าคุณพอดีกับเส้น / โลจิสติกการถดถอยโดยมีวัตถุประสงค์ของการประมาณการเป็นกลางของ1g(y)=a0+a1⋅x1+a2⋅x2g(y)=a0+a1⋅x1+a2⋅x2g(y) = a_0 + a_1\cdot x_1 + a_2\cdot x_2 . คุณมีความมั่นใจมากว่าทั้งสอง1และ2เป็นบวกมากเมื่อเทียบกับเสียงในประมาณการของพวกเขาa1a2a1a2\frac{a_1}{a_2}a1a1a_1a2a2a_2 หากคุณมีความแปรปรวนร่วมกันของ1 , 2คุณสามารถคำนวณหรืออย่างน้อยจำลองคำตอบ มีวิธีใดที่ดีกว่าและในปัญหาชีวิตจริงที่มีข้อมูลจำนวนมากคุณมีปัญหามากเพียงใดในการประเมินอัตราส่วนหรือสำหรับครึ่งขั้นตอนและสมมติว่าสัมประสิทธิ์เป็นอิสระ?a1,a2a1,a2a_1, a_2

1
Caret glmnet กับ cv.glmnet
ดูเหมือนจะมีความสับสนมากในการเปรียบเทียบการใช้glmnetภายในcaretเพื่อค้นหาแลมบ์ดาที่ดีที่สุดและใช้cv.glmnetในการทำงานเดียวกัน มีการตั้งคำถามมากมายเช่น: โมเดลการจำแนกประเภท train.glmnet vs. cv.glmnet วิธีที่เหมาะสมในการใช้ glmnet กับคาเร็ตคืออะไร? การตรวจสอบข้าม `glmnet 'โดยใช้` คาเร็ต' แต่ไม่ได้รับคำตอบซึ่งอาจเป็นเพราะความสามารถในการทำซ้ำของคำถาม ตามคำถามแรกฉันให้ตัวอย่างที่คล้ายกัน แต่มีคำถามเดียวกัน: ทำไม lambdas โดยประมาณแตกต่างกันอย่างไร library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to …

1
อัตราส่วนในการถดถอยหรือที่เรียกว่าคำถามเกี่ยวกับ Kronmal
เมื่อเร็ว ๆ นี้คำถามการสืบค้นแบบสุ่มทำให้เกิดความทรงจำเกี่ยวกับความเห็นนอกมือจากอาจารย์คนหนึ่งของฉันเมื่อสองสามปีก่อนเตือนเกี่ยวกับการใช้อัตราส่วนในแบบจำลองการถดถอย ดังนั้นฉันจึงเริ่มอ่านสิ่งนี้นำไปสู่ ​​Kronmal 1993 ในที่สุด ฉันต้องการตรวจสอบให้แน่ใจว่าฉันตีความคำแนะนำของเขาเกี่ยวกับวิธีการสร้างแบบจำลองเหล่านี้อย่างถูกต้อง สำหรับโมเดลที่มีอัตราส่วนซึ่งมีตัวหารเดียวกันทั้งในส่วนที่ขึ้นกับและอิสระ: Z- 1Y= Z- 11nβ0+ Z- 1XβX+ βZ+ Z- 1εZ-1Y=Z-11nβ0+Z-1XβX+βZ+Z-1ε Z^{-1}Y = Z^{-1}1_n\beta_0 + Z^{-1}X\beta_X + \beta_Z + Z^{-1}\epsilon ถอยหลังอัตราส่วนที่พึ่งพาในตัวแปรตัวหาร (ผกผัน) นอกเหนือจากอัตราส่วนอื่น ๆ น้ำหนักโดยตัวแปรตัวหาร (ผกผัน) สำหรับโมเดลที่มีตัวแปรตามเป็นอัตราส่วน: Y= β0+ βXX+ Z1nα0+ ZXαX+ Z- 1εY=β0+βXX+Z1nα0+ZXαX+Z-1ε Y = \beta_0 + \beta_XX + Z1_n\alpha_0 + ZX\alpha_X …

1
จะหาจุดตัวอย่างที่มีอัตราส่วนค่าผิดปกติขนาดใหญ่ที่มีความหมายทางสถิติระหว่างสองค่าของจุดได้อย่างไร
ในฐานะแอปพลิเคชันตัวอย่างให้พิจารณาคุณสมบัติสองประการของผู้ใช้ Stack Overflow: นับตั้งแต่ชื่อเสียงและมุมมองโปรไฟล์ คาดว่าสำหรับผู้ใช้ส่วนใหญ่ค่าทั้งสองนั้นจะเป็นสัดส่วน: ผู้ใช้ตัวแทนสูงดึงดูดความสนใจมากขึ้นและได้รับมุมมองโปรไฟล์มากขึ้น ดังนั้นจึงเป็นเรื่องที่น่าสนใจในการค้นหาผู้ใช้ที่มีจำนวนการดูโปรไฟล์มากเมื่อเทียบกับชื่อเสียงโดยรวม สิ่งนี้สามารถระบุได้ว่าผู้ใช้นั้นมีแหล่งภายนอกที่มีชื่อเสียง หรืออาจแค่ว่าพวกเขามีรูปโปรไฟล์และชื่อแปลก ๆ ที่น่าสนใจ ทางคณิตศาสตร์ยิ่งขึ้นตัวอย่างจุดสองมิติแต่ละจุดคือผู้ใช้และผู้ใช้แต่ละคนมีค่าที่สำคัญสองค่าตั้งแต่ 0 ถึง + อินฟินิตี้: ชื่อเสียง จำนวนการดูโปรไฟล์ พารามิเตอร์ทั้งสองนั้นคาดว่าจะขึ้นอยู่กับแบบเส้นตรงและเราต้องการค้นหาจุดตัวอย่างซึ่งเป็นค่าผิดปกติที่ใหญ่ที่สุดในสมมติฐานนั้น แน่นอนว่าวิธีแก้ปัญหาที่ไร้เดียงสานั้นจะเป็นเพียงการดูโปรไฟล์แบ่งตามชื่อเสียงและการจัดเรียง อย่างไรก็ตามสิ่งนี้จะให้ผลลัพธ์ที่ไม่มีความหมายทางสถิติ ตัวอย่างเช่นหากผู้ใช้ตอบคำถามได้รับ 1 upvote และด้วยเหตุผลบางอย่างมี 10 การดูโปรไฟล์ซึ่งง่ายต่อการปลอมผู้ใช้นั้นจะปรากฏต่อหน้าผู้สมัครที่น่าสนใจมากกว่าที่มี 1,000 upvotes และ 5000 profile profile . ในกรณีการใช้ "โลกแห่งความเป็นจริง" ที่มากขึ้นเราอาจลองตอบคำถาม "ซึ่ง startups คือยูนิคอร์นที่มีความหมายมากที่สุด?" เช่นหากคุณลงทุน 1 ดอลลาร์ด้วยเงินทุนเพียงเล็กน้อยคุณสร้างยูนิคอร์น: https://www.linkedin.com/feed/update/urn:li:activity:6362648516858310656 ข้อมูลคอนกรีตที่สะอาดและง่ายต่อการใช้งานในโลกแห่งความจริง เพื่อทดสอบวิธีการแก้ปัญหาของคุณคุณสามารถใช้ไฟล์ที่ประมวลผลแล้วซึ่งถูกบีบอัดขนาดเล็ก (75M, ผู้ใช้ ~ 10M) …
12 ratio 

3
ปัญหาของการใช้เปอร์เซ็นต์ผลลัพธ์ในการถดถอยเชิงเส้นคืออะไร
ฉันมีการศึกษาที่ผลลัพธ์จำนวนมากแสดงเป็นเปอร์เซ็นต์และฉันใช้การถดถอยเชิงเส้นหลายครั้งเพื่อประเมินผลของตัวแปรหมวดหมู่ต่อผลลัพธ์เหล่านี้ ฉันสงสัยว่าเนื่องจากการถดถอยเชิงเส้นสันนิษฐานว่าผลลัพธ์คือการกระจายอย่างต่อเนื่องมีปัญหาเกี่ยวกับระเบียบวิธีในการใช้แบบจำลองดังกล่าวกับเปอร์เซ็นต์ซึ่งมีข้อ จำกัด ระหว่าง 0 ถึง 100

3
อัตราส่วนของการกระจายตัวสม่ำเสมอและปกติคืออะไร?
ให้ติดตามการกระจายตัวแบบสม่ำเสมอและติดตามการกระจายตัวแบบปกติ สิ่งที่สามารถจะกล่าวเกี่ยวกับ ? มีการกระจายสำหรับมันหรือไม่?Y XXXXYYYXYXY\frac X Y ฉันพบอัตราส่วนของสองบรรทัดฐานที่มีค่าเฉลี่ยเป็นศูนย์คือโคชี

1
การกระจายตัวของอัตราส่วนของตัวแปรสุ่มไคสแควร์แบบพึ่งพา
สมมติว่าโดยที่เป็นอิสระX=X1+X2+⋯+XnX=X1+X2+⋯+Xn X = X_1 + X_2+\cdots+ X_n Xi∼N(0,σ2)Xi∼N(0,σ2)X_i \sim N(0,\sigma^2) คำถามของฉันคือการกระจายอะไรบ้าง Z=X2X21+X22+⋯+X2nZ=X2X12+X22+⋯+Xn2 Z = \frac{X^2}{X_1^2 + X_2^2 + \cdots + X_n^2} ทำตาม? ฉันรู้จากที่นี่ว่าอัตราส่วนของตัวแปรสุ่มไคสแควร์สองตัวแสดงเป็นตามการแจกแจงแบบเบต้า ผมคิดว่านี้จะถือว่าเป็นอิสระระหว่างและYในกรณีของฉันตัวส่วนของมีส่วนประกอบของกำลังสองWW+YWW+Y\frac{W}{W + Y}WWWYYYZZZXXX ฉันคิดว่าต้องติดตามความผันแปรของการกระจายเบต้า แต่ฉันไม่แน่ใจ และถ้าสมมติฐานนี้ถูกต้องฉันก็ไม่รู้จะพิสูจน์มันได้อย่างไรZZZ

1
ค่าที่คาดหวังของอัตราส่วนสูงสุดของตัวแปรปกติ n iid
สมมติว่าX1, . . . , XnX1,...,XnX_1,...,X_nจะ IID จากยังไม่มีข้อความ( μ , σ2)ยังไม่มีข้อความ(μ,σ2)N(\mu,\sigma^2)และให้หมายถึง 'TH องค์ประกอบที่เล็กจากX_1,เราจะสามารถผูกอัตราส่วนสูงสุดไว้กับอัตราส่วนระหว่างสององค์ประกอบที่ต่อเนื่องในอย่างไร นั่นคือคุณจะคำนวณส่วนบนได้อย่างไร:X( i )X(ผม)X_{(i)}ผมผมiX1, . . . , XnX1,...,XnX_1,...,X_nX( i )X(ผม)X_{(i)} E[ สูงสุดฉัน= 1 , . . , n - 1( X( i + 1 )X( i )) ]E[สูงสุดผม=1,...,n-1(X(ผม+1)X(ผม))]E\left[\max\limits_{i=1,...,n-1}\left(\frac{X_{(i+1)}}{X_{(i)}}\right)\right] วรรณกรรมที่ฉันสามารถค้นหาได้นั้นมุ่งเน้นไปที่อัตราส่วนระหว่างตัวแปรสุ่มสองตัวซึ่งส่งผลให้มีการแจกแจงอัตราส่วนซึ่ง pdf สำหรับการแจกแจงปกติที่ไม่ได้รับการแจกแจงสองตัวจะได้รับที่นี่: https://en.wikipedia.org/wiki/ Ratio_distribution ในขณะนี้สิ่งนี้จะช่วยให้ฉันสามารถอัตราส่วนอัตราส่วนเฉลี่ยที่คาดหวังของตัวแปรฉันไม่สามารถดูวิธีการทั่วไปแนวคิดนี้เพื่อค้นหาอัตราส่วนสูงสุดที่คาดหวังของตัวแปรnnnnnnn

2
ควรจำแนกประเภทของข้อมูล (ชื่อ / ลำดับ / ช่วงเวลา / อัตราส่วน) จริงหรือไม่?
ตัวอย่างเช่นนี่คือคำจำกัดความที่ฉันได้รับจากหนังสือเรียนมาตรฐาน Variable - ลักษณะของประชากรหรือกลุ่มตัวอย่าง อดีต ราคาหุ้นหรือเกรดจากการทดสอบ ข้อมูล - ค่าที่สังเกตได้จริง ดังนั้นสำหรับรายงานสองคอลัมน์ [ชื่อ | รายได้] ชื่อคอลัมน์จะเป็นตัวแปรและค่าที่สังเกตได้จริง {dave | 100K}, {jim | 200K} จะเป็นข้อมูล ดังนั้นถ้าฉันบอกว่าคอลัมน์ [ชื่อ] เป็นข้อมูลที่ระบุและ [รายได้] เป็นข้อมูลอัตราส่วนฉันจะไม่ถูกต้องมากกว่าที่จะอธิบายว่ามันเป็นตัวแปรชนิดหนึ่งแทนที่จะเป็นประเภทข้อมูลที่ตำราเรียนส่วนใหญ่ทำหรือไม่ ฉันเข้าใจว่านี่อาจเป็นความหมายและก็ไม่เป็นไรนั่นคือทั้งหมดที่มีเช่นกัน แต่ฉันกลัวว่าฉันอาจจะพลาดบางสิ่งบางอย่างที่นี่

1
การทดสอบอัตราส่วนชาร์ปอย่างมีนัยสำคัญ
วิธีที่เหมาะสมในการทดสอบความสำคัญของอัตราส่วน Sharpe หรืออัตราส่วนข้อมูลคืออะไร? อัตราส่วน Sharpe จะขึ้นอยู่กับดัชนีส่วนต่าง ๆ และอาจมีช่วงเวลามองย้อนกลับไปตัวแปร ทางออกหนึ่งที่ฉันได้เห็นอธิบายเพียงใช้ทดสอบนักเรียนกับ df ตั้งระยะเวลาในการมองย้อนกลับ ฉันลังเลที่จะใช้วิธีการข้างต้นเนื่องจากข้อกังวลดังต่อไปนี้: ฉันเชื่อว่า t-test นั้นมีความอ่อนไหวต่อความเบ้ ค่าเฉลี่ยผลตอบแทนที่คำนวณโดยใช้การส่งคืนค่าน้อยกว่าค่าเฉลี่ยผลตอบแทนที่คำนวณโดยใช้ผลตอบแทนแบบง่าย ฉันคิดว่าสิ่งนี้จะทำให้มีโอกาสมากขึ้นที่อัตราส่วน Sharpe ที่ให้ผลตอบแทนแบบง่ายจะลงทะเบียนว่ามีนัยสำคัญเมื่อเทียบกับ Sharpe ที่ใช้อัตราส่วนผลตอบแทนกลับมา หากช่วงเวลาที่มองย้อนกลับไปมีขนาดเล็ก (เช่นขนาดตัวอย่างเล็ก) การทดสอบ t อาจเหมาะสม แต่เกณฑ์ใดที่เหมาะสมที่จะใช้การทดสอบอื่น ความโน้มเอียงแรกของฉันคือการหลีกเลี่ยงการใช้การกระจายนักศึกษา -t และสร้างการทดสอบตามการกระจายพลังงานแบบอสมมาตรซึ่งฉันได้อ่านได้แสดงให้เห็นว่าใกล้เคียงกับผลตอบแทนของตลาดตราสารทุนมากขึ้น ความชอบครั้งที่สองของฉันคือการดูการทดสอบแบบไม่อิงพารามิเตอร์ แต่มีประสบการณ์ จำกัด ในการใช้งานของพวกเขาฉันไม่แน่ใจว่าจะเริ่มต้นอย่างไรและควรหลีกเลี่ยงข้อผิดพลาดอะไร ฉันคิดมากปัญหานี้หรือไม่

1
ถ้า X / Y มีการแจกแจงแบบเดียวกับ Z จริงหรือไม่ที่ X มีการแจกแจงแบบเดียวกับ YZ?
ให้ X, Y และ Z เป็นสามตัวแปรสุ่มอิสระ ถ้า X / Y มีการแจกแจงแบบเดียวกับ Z จริงหรือไม่ที่ X มีการแจกแจงแบบเดียวกับ YZ?
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.