คำถามติดแท็ก skewness

มาตรการความเบ้ (หรืออ้างถึง) ระดับของความไม่สมดุลในการกระจายตัวของตัวแปร

3
หมายถึง SD หรือ Median MAD เพื่อสรุปตัวแปรที่เอียงสูงหรือไม่
ฉันกำลังทำงานกับข้อมูลที่เบ้อย่างสูงดังนั้นฉันจึงใช้ค่ามัธยฐานแทนค่าเฉลี่ยเพื่อสรุปแนวโน้มกลาง ฉันต้องการที่จะมีตัวชี้วัดของการกระจายตัวในขณะที่ฉันมักจะเห็นคนรายงานค่าเฉลี่ยเบี่ยงเบนมาตรฐาน±±\pmหรือแบ่งควอไทล์±±\pmเพื่อสรุปแนวโน้มเข้าสู่ส่วนกลางมันก็โอเคที่จะรายงานค่ามัธยฐานแบ่งกระจายสัมบูรณ์ (MAD)±±\pm ? มีปัญหาที่อาจเกิดขึ้นกับวิธีนี้หรือไม่? ฉันจะพบว่าวิธีนี้มีขนาดกะทัดรัดและใช้งานง่ายกว่าการรายงานควอไทล์ที่ต่ำและสูงโดยเฉพาะในตารางขนาดใหญ่ที่เต็มไปด้วยตัวเลข

5
ฉันสามารถทดสอบสมมติฐานหาข้อมูลปกติได้หรือไม่
ฉันมีการรวบรวมข้อมูลซึ่ง แต่เดิมฉันคิดว่ามันถูกแจกจ่ายตามปกติ จากนั้นฉันก็ดูมันและตระหนักว่าไม่ใช่เพราะส่วนใหญ่เป็นข้อมูลที่เบ้และฉันก็ทำการทดสอบ shapiro-wilks ด้วย ฉันยังต้องการวิเคราะห์โดยใช้วิธีการทางสถิติและฉันต้องการทดสอบสมมติฐานสำหรับความเบ้ ดังนั้นฉันอยากทราบว่ามีวิธีทดสอบความเป็นปรกติหรือไม่และถ้าเป็นไปได้ห้องสมุดที่ทำแบบทดสอบให้ฉัน

4
วิธีที่ดีที่สุดในการวิเคราะห์ระยะเวลาการพักข้อมูลใน RCT ที่ใช้ในโรงพยาบาล
ฉันสนใจที่จะรู้ว่ามีมติเกี่ยวกับวิธีที่ดีที่สุดในการวิเคราะห์ข้อมูลระยะเวลาการพักอาศัย (LOS) ของโรงพยาบาลจาก RCT หรือไม่ นี่คือการแจกแจงแบบเบ้ขวามากโดยผู้ป่วยส่วนใหญ่จะออกจากโรงพยาบาลภายในไม่กี่วันถึงหนึ่งสัปดาห์ แต่ผู้ป่วยที่เหลือมีการคาดเดาไม่ได้ ตัวเลือกสำหรับการวิเคราะห์รวมถึง: ทดสอบ t (สมมติว่าปกติซึ่งไม่น่าจะเป็นปัจจุบัน) การทดสอบ Mann Whitney U การทดสอบ logrank การปรับโมเดลโมเดลอันตราย Cox ตามสัดส่วนในการจัดสรรกลุ่ม วิธีใด ๆ เหล่านี้มีพลังที่สูงกว่าอย่างเห็นได้ชัดหรือไม่?

1
การประมาณพารามิเตอร์สำหรับการแจกแจงแบบเบ้ปกติ
พารามิเตอร์ formulaic มีการประมาณการสำหรับ skew-normal หรือไม่ ถ้าคุณทำได้มาจาก MLE หรือ Mom ก็ยอดเยี่ยมเช่นกัน ขอบคุณ แก้ไข ฉันมีชุดข้อมูลที่ฉันสามารถบอกได้ด้วยตาเปล่าโดยการแปลงจะเอียงไปทางซ้ายเล็กน้อย ฉันต้องการประเมินค่าเฉลี่ยและความแปรปรวนจากนั้นทำการทดสอบความเหมาะสม (ซึ่งเป็นสาเหตุที่ฉันต้องการค่าประมาณพารามิเตอร์) ฉันคิดถูกหรือไม่ว่าฉันแค่ต้องเดาความเบ้ (อัลฟา) (อาจจะทำแบบทดสอบหลายอย่างและแบบทดสอบที่ดีที่สุด?) ฉันต้องการ MLE ที่ได้มาเพื่อความเข้าใจของฉันเอง - ต้องการ MLE มากกว่า MoM เนื่องจากฉันคุ้นเคยกับมันมากกว่า ฉันไม่แน่ใจว่ามีการเอียงทั่วไปมากกว่าหนึ่งแบบปกติ - ฉันแค่หมายถึงค่าเฉลี่ยที่เอียงเล็กน้อย! หากเป็นไปได้การประมาณค่าพารามิเตอร์พลังงานแบบเลขชี้กำลังของเบ้จะเป็นประโยชน์เช่นกัน!

2
แปลงตัวแปรต่อเนื่องสำหรับการถดถอยโลจิสติก
ฉันมีข้อมูลการสำรวจขนาดใหญ่ตัวแปรผลลัพธ์ไบนารีและตัวแปรอธิบายมากมายรวมถึงไบนารีและต่อเนื่อง ฉันกำลังสร้างชุดแบบจำลอง (ทดลองกับทั้ง GLM และ GLM แบบผสม) และใช้วิธีการทางทฤษฎีข้อมูลเพื่อเลือกแบบจำลองชั้นนำ ฉันตรวจสอบคำอธิบายอย่างระมัดระวัง (ทั้งแบบต่อเนื่องและแบบแบ่งหมวดหมู่) สำหรับความสัมพันธ์และฉันใช้เฉพาะในรูปแบบเดียวกันที่มีค่าสัมประสิทธิ์ Pearson หรือ Phicorr น้อยกว่า 0.3 ฉันต้องการให้โอกาสต่อเนื่องของตัวแปรทั้งหมดในการแข่งขันกับนางแบบชั้นนำ จากประสบการณ์ของฉันการเปลี่ยนสิ่งที่ต้องการโดยยึดตามความเบ้ปรับปรุงโมเดลที่พวกเขาเข้าร่วม (AIC ที่ต่ำกว่า) คำถามแรกของฉันคือ: การปรับปรุงนี้เพราะการเปลี่ยนแปลงช่วยเพิ่มความเป็นเชิงเส้นกับ logit หรือไม่ หรือการแก้ไขความเบ้ช่วยปรับปรุงความสมดุลของตัวแปรอธิบายอย่างใดด้วยการทำให้ข้อมูลสมมาตรมากขึ้น? ฉันหวังว่าฉันจะเข้าใจเหตุผลทางคณิตศาสตร์ที่อยู่เบื้องหลังเรื่องนี้ แต่สำหรับตอนนี้ถ้าใครบางคนสามารถอธิบายสิ่งนี้ในแง่ง่ายนั่นจะเป็นการดี หากคุณมีการอ้างอิงใด ๆ ที่ฉันสามารถใช้ได้ฉันจะขอบคุณมันจริงๆ เว็บไซต์อินเทอร์เน็ตหลายแห่งบอกว่าเพราะความเป็นมาตรฐานไม่ใช่ข้อสันนิษฐานในการถดถอยโลจิสติกแบบไบนารีอย่าเปลี่ยนตัวแปร แต่ฉันรู้สึกว่าถ้าไม่เปลี่ยนตัวแปรของฉันฉันจะเสียเปรียบเมื่อเทียบกับคนอื่น ๆ และอาจส่งผลกระทบต่อสิ่งที่โมเดลชั้นนำและเปลี่ยนการอนุมาน (ดีมันมักจะไม่ได้ ตัวแปรของฉันบางอย่างทำงานได้ดีขึ้นเมื่อบันทึกการเปลี่ยนแปลงบางอย่างเมื่อยกกำลังสอง (ทิศทางที่แตกต่างกันของความลาดเอียง) และบางตัวแปรที่ไม่ได้เปลี่ยนแปลง ใครบางคนจะสามารถให้แนวทางแก่ฉันในการระวังการเปลี่ยนตัวแปรอธิบายสำหรับการถดถอยโลจิสติกและถ้าไม่ทำมันทำไมไม่

1
การแสดงภาพการแจกแจงแบบเบ้ซ้ายจำนวนมาก
ฉันมีชุดของการแจกแจงแบบเบ้ซ้าย / หนักที่ฉันต้องการแสดง 42 มีการกระจายทั่วทั้งสามปัจจัยคือ (ระบุว่าเป็นA, BและCด้านล่าง) Bนอกจากนี้การเปลี่ยนแปลงจะหดตัวทั่วปัจจัย ปัญหาที่ฉันมีคือการกระจายยากที่จะแยกความแตกต่างในระดับของผลลัพธ์ (อัตราส่วนหรือพับเปลี่ยน): ดูเหมือนว่าการบันทึกข้อมูลจะเน้นไปที่ความเบ้ด้านซ้ายและย้ายตัวอย่างไปที่ก้อยมากขึ้น (สร้างจุดที่ผิดพลาด) ใครบ้างมีคำแนะนำเกี่ยวกับเทคนิคอื่น ๆ สำหรับการแสดงข้อมูลเหล่านี้?

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

2
kurtosis ขนาดมหึมา?
ฉันกำลังทำสถิติเชิงพรรณนาของผลตอบแทนรายวันจากดัชนีหุ้น คือถ้าและP 2เป็นระดับของดัชนีในวันที่ 1 และวันที่ 2 ตามลำดับจากนั้นl o g e ( P 2P1P1P_1P2P2P_2คือผลตอบแทนที่ฉันใช้ (มาตรฐานสมบูรณ์ในวรรณกรรม)loge(P2P1)loge(P2P1)log_e (\frac{P_2}{P_1}) ดังนั้นความโด่งจึงมีมากในบางส่วนของสิ่งเหล่านี้ ฉันกำลังดูข้อมูลรายวันประมาณ 15 ปี (ประมาณการสังเกตอนุกรมเวลา)260∗15260∗15260 * 15 means sds mins maxs skews kurts ARGENTINA -0.00031 0.00965 -0.33647 0.13976 -15.17454 499.20532 AUSTRIA 0.00003 0.00640 -0.03845 0.04621 0.19614 2.36104 CZECH.REPUBLIC 0.00008 0.00800 -0.08289 0.05236 -0.16920 5.73205 FINLAND …

3
มีความเทียบเท่าปกติกับความเบ้และ Kurtosis?
อะไรจะเทียบเท่าปกติกับความเบ้ที่จะมีหน่วยเดียวกับข้อมูล? ในทำนองเดียวกันสิ่งที่จะเทียบเท่าปกติ Kurtosis? จะเป็นการดีที่ฟังก์ชั่นเหล่านี้ควรเป็นเชิงเส้นที่มีความเคารพต่อข้อมูลที่มีความหมายว่าถ้าสังเกตทั้งหมดจะถูกคูณด้วยปัจจัยที่ส่งผลปกติเบ้และความโด่งจะคูณด้วยปัจจัยเดียวกันn nประโยชน์ของการมีการเทียบเท่าปกติดังกล่าวจะสามารถซ้อนทับพวกเขาด้านบนของพล็อตกล่องและมัสสุมาตรฐาน

2
สังเกตพบการกระจายตัวแบบเบ้ซ้ายและสมมาตร
มันค่อนข้างยากสำหรับฉันที่จะอธิบาย แต่ฉันจะพยายามทำให้ปัญหาของฉันเป็นที่เข้าใจได้ ก่อนอื่นคุณต้องรู้ว่าฉันได้ทำการถดถอยเชิงเส้นอย่างง่ายจนถึงตอนนี้ ก่อนที่ผมจะประมาณค่าสัมประสิทธิ์ฉันดูการกระจายของฉันYมันหนักไปทางซ้ายเบ้ หลังจากที่ฉันประเมินแบบจำลองแล้วฉันค่อนข้างแน่ใจว่าจะสังเกตสิ่งที่เหลืออยู่แบบเบ้ซ้ายในรูปแบบ QQ-Plot เป็น wel แต่ฉันไม่ได้ทำอย่างแน่นอน อะไรคือสาเหตุของการแก้ไขนี้? ความผิดพลาดอยู่ที่ไหน หรือมีการกระจายอะไรจะทำอย่างไรกับการกระจายของระยะข้อผิดพลาดหรือไม่YYyYYy

1
เราสามารถเขียนการแจกแจงเบ้ที่ถูกต้องได้เสมอในแง่ขององค์ประกอบของการแจกแจงโดยพลการและสมมาตรหรือไม่?
พิจารณาละสองครั้งอนุพันธ์และการกระจายสมมาตร\ทีนี้ลองพิจารณาการแจกแจงที่แตกต่างกันสองครั้งที่สอง rigth บิดเบือนในแง่ที่FXFX\mathcal{F}_XFZFZ\mathcal{F}_Z ( 1 )FX⪯คFZ.(1)FX⪯cFZ.(1)\quad\mathcal{F}_X\preceq_c\mathcal{F}_Z. โดยที่⪯ค⪯c\preceq_cเป็นคำสั่งนูนของ van Zwet [0] ดังนั้น( 1 )(1)(1)จึงเท่ากับ: ( 2 )F- 1ZFX( x ) เป็นนูน ∀ x ∈ R(2)FZ−1FX(x) is convex ∀x∈R.(2)\quad F^{-1}_ZF_X(x)\text{ is convex $\forall x\in\mathbb{R}.$} ลองพิจารณาการแจกแจงที่แตกต่างกันสองสามครั้งFYFY\mathcal{F}_Yน่าพอใจ: ( 3 )FY⪯คFZ.(3)FY⪯cFZ.(3)\quad\mathcal{F}_Y\preceq_c\mathcal{F}_Z. คำถามของฉันคือเราสามารถหาการแจกแจงFYFY\mathcal{F}_YและการกระจายแบบสมมาตรFXFX\mathcal{F}_Xเพื่อเขียน\ mathcal {F} _Zใด ๆFZFZ\mathcal{F}_Z (ทั้งสามนิยามไว้ข้างต้น) ในแง่ขององค์ประกอบของFXFX\mathcal{F}_Xและ FYFY\mathcal{F}_Yเป็น: FZ( z) =FYF- 1XFY( z)FZ(z)=FYFX−1FY(z)F_Z(z)=F_YF_X^{-1}F_Y(z) หรือไม่? …

1
ทำให้เชื่องเอียง ... ทำไมจึงมีฟังก์ชั่นเอียงมากมาย?
ฉันหวังว่าจะมีความเข้าใจที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับความเบ้สี่ประเภทจากชุมชนนี้ ประเภทที่ฉันอ้างถึงมีการกล่าวถึงในhttp://www.inside-r.org/packages/cran/e1071/docs/skewnessหน้าช่วยเหลือ วิธีการเก่าไม่ได้กล่าวถึงในหน้าช่วยเหลือ แต่ฉันรวมถึงมันอย่างไรก็ตาม require(moments) require(e1071) x=rnorm(100) n=length(x) hist(x) ###############type=1 e1071::skewness(x,type=1) sqrt(n) * sum((x-mean(x))^3)/(sum((x - mean(x))^2)^(3/2)) #from e1071::skewness source m_r=function(x,r) {n=length(x); sum((x - mean(x))^r/n);} ##from e1071::skewness help g_1=function(x) m_r(x,3)/m_r(x,2)^(3/2) g_1(x) ##from e1071::skewness help moments::skewness(x) ##from e1071::skewness help (sum((x - mean(x))^3)/n)/(sum((x - mean(x))^2)/n)^(3/2) ##from moments::skewness code, exactly as skewness help page …
9 skewness 

2
ตัวแปรเอียงใน PCA หรือการวิเคราะห์ปัจจัย
ฉันต้องการทำการวิเคราะห์องค์ประกอบหลัก (การวิเคราะห์ปัจจัย) บน SPSS โดยใช้ตัวแปร 22 ตัว อย่างไรก็ตามตัวแปรบางตัวของฉันเบ้มาก (ความเบ้คำนวณจาก SPSS อยู่ในช่วง 2-80!) ดังนั้นนี่คือคำถามของฉัน: ฉันควรเก็บตัวแปรที่เอียงเหล่านั้นไว้หรือฉันสามารถเปลี่ยนตัวแปรในการวิเคราะห์องค์ประกอบหลักได้หรือไม่ ถ้าใช่ฉันจะตีความคะแนนตัวประกอบอย่างไร ฉันควรเปลี่ยนรูปแบบใด log10 หรือ ln เดิมที KMO ของฉัน (Kaiser – Meyer – Olkin) คือ 0.413 วรรณกรรมจำนวนมากแนะนำขั้นต่ำ 0.5 ฉันยังคงทำการวิเคราะห์ปัจจัยหรือฉันต้องลบตัวแปรเพื่อเพิ่ม KMO ของฉันเป็น 0.5 หรือไม่
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.