คำถามติดแท็ก statistical-significance

นัยสำคัญทางสถิติหมายถึงความน่าจะเป็นที่ถ้าในประชากรที่ตัวอย่างนี้ถูกดึงออกมาผลที่แท้จริงคือ 0 (หรือค่าที่ตั้งสมมติฐานไว้บางส่วน) สถิติทดสอบที่มากหรือสุดขั้วเกินกว่าที่จะเกิดขึ้นในกลุ่มตัวอย่าง

1
การทดสอบอย่างมีนัยสำคัญทำให้รู้สึกถึงการเปรียบเทียบกลุ่มแบบสุ่มที่พื้นฐานหรือไม่
เอกสาร Randomized Controll Trial (RCT) จำนวนมากรายงานการทดสอบที่สำคัญเกี่ยวกับพารามิเตอร์พื้นฐานหลังจาก / ก่อนการสุ่มเพื่อแสดงให้เห็นว่ากลุ่มนั้นคล้ายกันจริง ๆ นี่มักเป็นส่วนหนึ่งของตาราง "คุณสมบัติพื้นฐาน" อย่างไรก็ตามการทดสอบนัยสำคัญวัดความน่าจะเป็นที่จะได้รับความแตกต่างที่สังเกต (หรือมากกว่า) โดยบังเอิญใช่ไหม และถ้าการทดสอบนั้นสำคัญเราก็สรุปได้ว่ามีความแตกต่างที่แท้จริงเพราะความแตกต่างแบบสุ่มของขอบเขตนั้นจะไม่น่าเป็นไปได้ การทดสอบอย่างมีนัยสำคัญทำให้เกิดความรู้สึกหลังจากสุ่มเมื่อเรารู้ว่าความแตกต่างใด ๆต้องเกิดจากโอกาสหรือไม่?

4
วิธีการมองหาหุบเขาในกราฟ?
ฉันกำลังตรวจสอบข้อมูลความครอบคลุมจีโนมซึ่งโดยทั่วไปเป็นจำนวนเต็ม (ไม่กี่ล้านค่า) ของจำนวนเต็มแต่ละคนบอกว่าตำแหน่งนี้ในจีโนมดีแค่ไหน (หรือ "ลึก") ฉันต้องการค้นหา "หุบเขา" ในข้อมูลนี้นั่นคือภูมิภาคที่ "ต่ำ" อย่างมีนัยสำคัญมากกว่าสภาพแวดล้อมโดยรอบ โปรดทราบว่าขนาดของหุบเขาที่ฉันกำลังมองหาอาจมีตั้งแต่ 50 ฐานไปจนถึงสองสามพันแห่ง คุณอยากจะแนะนำกระบวนทัศน์ประเภทใดในการค้นหาหุบเขาเหล่านั้น UPDATE ตัวอย่างกราฟิกสำหรับข้อมูล: อัพเดท 2 การกำหนดว่าหุบเขาคืออะไรแน่นอนว่าเป็นหนึ่งในคำถามที่ฉันต้องดิ้นรน นี่คือสิ่งที่ชัดเจนสำหรับฉัน: แต่มีบางสถานการณ์ที่ซับซ้อนมากขึ้น โดยทั่วไปมีหลักเกณฑ์ 3 ข้อที่ฉันพิจารณา: 1. ความครอบคลุม (โดยเฉลี่ย? สูงสุด) ในหน้าต่างที่เกี่ยวข้องกับค่าเฉลี่ยทั่วโลก 2. ความครอบคลุม (... ) ในหน้าต่างที่เกี่ยวกับบริเวณโดยรอบ 3. วิธีการที่มีขนาดใหญ่เป็นหน้าต่าง: หากฉันเห็นความคุ้มครองที่ต่ำมากสำหรับช่วงสั้น ๆ เป็นที่น่าสนใจถ้าฉันเห็นความคุ้มครองที่ต่ำมากสำหรับช่วงยาวก็ยังน่าสนใจถ้าฉันเห็นความคุ้มครองต่ำอย่างอ่อนโยนสำหรับช่วงสั้นก็ไม่น่าสนใจจริงๆ แต่ถ้าฉันเห็นการครอบคลุมที่ต่ำอย่างอ่อนโยนเป็นเวลานาน - มันคือ .. ดังนั้นมันจึงเป็นการรวมกันของความยาวของ sapn และความครอบคลุม ยิ่งฉันปล่อยให้ความคุ้มครองสูงเท่าไหร่และยิ่งคิดว่าเป็นหุบเขา ขอบคุณ เดฟ

2
'' ตัวแปรที่สำคัญ '' ที่ไม่ได้ปรับปรุงการพยากรณ์นอกตัวอย่าง - จะตีความได้อย่างไร
ฉันมีคำถามที่ฉันคิดว่าจะค่อนข้างพื้นฐานสำหรับผู้ใช้จำนวนมาก ฉันใช้ตัวแบบการถดถอยเชิงเส้นเพื่อ (i) ตรวจสอบความสัมพันธ์ของตัวแปรอธิบายหลายตัวและตัวแปรตอบสนองของฉันและ (ii) ทำนายตัวแปรตอบสนองของฉันโดยใช้ตัวแปรอธิบาย ตัวแปรอธิบายอย่างใดอย่างหนึ่ง X ดูเหมือนจะส่งผลกระทบต่อตัวแปรตอบกลับของฉันอย่างมาก เพื่อทดสอบมูลค่าเพิ่มของตัวแปรอธิบายนี้เพื่อวัตถุประสงค์ในการคาดการณ์นอกตัวอย่างของตัวแปรตอบสนองของฉันฉันใช้สองแบบจำลอง: model (a) ซึ่งใช้ตัวแปรอธิบายและแบบจำลองทั้งหมด (b) ซึ่งใช้ตัวแปรทั้งหมด ยกเว้นตัวแปร X สำหรับทั้งสองรุ่นฉันรายงานประสิทธิภาพนอกตัวอย่างเท่านั้น ปรากฏว่าทั้งสองรุ่นมีประสิทธิภาพเกือบเหมือนกัน กล่าวอีกนัยหนึ่งการเพิ่มตัวแปรอธิบาย X ไม่ได้ปรับปรุงการพยากรณ์นอกตัวอย่าง โปรดทราบว่าฉันยังใช้ model (a) เช่นโมเดลที่มีตัวแปรอธิบายทั้งหมดเพื่อค้นหาว่าตัวแปรอธิบาย X ส่งผลกระทบอย่างมากต่อตัวแปรตอบกลับของฉัน คำถามของฉันคือ: จะตีความการค้นพบนี้ได้อย่างไร? ข้อสรุปที่ตรงไปตรงมาคือแม้ว่าตัวแปร X ดูเหมือนจะมีอิทธิพลต่อตัวแปรตอบสนองของฉันอย่างมีนัยสำคัญโดยใช้แบบจำลองที่อนุมานได้ แต่ก็ไม่ได้ปรับปรุงการทำนายนอกตัวอย่าง อย่างไรก็ตามฉันมีปัญหาในการอธิบายการค้นพบนี้เพิ่มเติม สิ่งนี้จะเป็นไปได้อย่างไรและอะไรคือคำอธิบายสำหรับการค้นพบนี้ ขอบคุณล่วงหน้า! ข้อมูลเพิ่มเติม: ด้วย 'อิทธิพลอย่างมีนัยสำคัญ' ฉันหมายความว่า 0 ไม่รวมอยู่ในช่วงความหนาแน่นหลังสูงสุด 95% ของการประมาณพารามิเตอร์ (ฉันใช้วิธีเบส์) ในแง่บ่อยๆสิ่งนี้มีความสัมพันธ์กับการมีค่า p ต่ำกว่า 0.05 …

1
การทดสอบอัตราส่วนชาร์ปอย่างมีนัยสำคัญ
วิธีที่เหมาะสมในการทดสอบความสำคัญของอัตราส่วน Sharpe หรืออัตราส่วนข้อมูลคืออะไร? อัตราส่วน Sharpe จะขึ้นอยู่กับดัชนีส่วนต่าง ๆ และอาจมีช่วงเวลามองย้อนกลับไปตัวแปร ทางออกหนึ่งที่ฉันได้เห็นอธิบายเพียงใช้ทดสอบนักเรียนกับ df ตั้งระยะเวลาในการมองย้อนกลับ ฉันลังเลที่จะใช้วิธีการข้างต้นเนื่องจากข้อกังวลดังต่อไปนี้: ฉันเชื่อว่า t-test นั้นมีความอ่อนไหวต่อความเบ้ ค่าเฉลี่ยผลตอบแทนที่คำนวณโดยใช้การส่งคืนค่าน้อยกว่าค่าเฉลี่ยผลตอบแทนที่คำนวณโดยใช้ผลตอบแทนแบบง่าย ฉันคิดว่าสิ่งนี้จะทำให้มีโอกาสมากขึ้นที่อัตราส่วน Sharpe ที่ให้ผลตอบแทนแบบง่ายจะลงทะเบียนว่ามีนัยสำคัญเมื่อเทียบกับ Sharpe ที่ใช้อัตราส่วนผลตอบแทนกลับมา หากช่วงเวลาที่มองย้อนกลับไปมีขนาดเล็ก (เช่นขนาดตัวอย่างเล็ก) การทดสอบ t อาจเหมาะสม แต่เกณฑ์ใดที่เหมาะสมที่จะใช้การทดสอบอื่น ความโน้มเอียงแรกของฉันคือการหลีกเลี่ยงการใช้การกระจายนักศึกษา -t และสร้างการทดสอบตามการกระจายพลังงานแบบอสมมาตรซึ่งฉันได้อ่านได้แสดงให้เห็นว่าใกล้เคียงกับผลตอบแทนของตลาดตราสารทุนมากขึ้น ความชอบครั้งที่สองของฉันคือการดูการทดสอบแบบไม่อิงพารามิเตอร์ แต่มีประสบการณ์ จำกัด ในการใช้งานของพวกเขาฉันไม่แน่ใจว่าจะเริ่มต้นอย่างไรและควรหลีกเลี่ยงข้อผิดพลาดอะไร ฉันคิดมากปัญหานี้หรือไม่

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

4
ฉันจะตรวจสอบว่าสองสหสัมพันธ์มีความแตกต่างอย่างมีนัยสำคัญได้อย่างไร
ฉันต้องการพิจารณาว่าชุดข้อมูลสองชุดใด (B1, B2) ดีกว่าสัมพันธ์ (pearsons r) กับชุดอื่น (A) ไม่มีข้อมูลในชุดข้อมูลทั้งหมด ฉันจะทราบได้อย่างไรว่าความสัมพันธ์ที่เกิดขึ้นมีความแตกต่างอย่างมีนัยสำคัญหรือไม่? เช่นค่า 8426 มีทั้ง A และ B1, r = 0.74 8798 มีอยู่ทั้ง A และ B2, r = 0.72 ฉันคิดว่าคำถามนี้อาจช่วยได้ แต่ก็ยังไม่ได้รับคำตอบ: จะรู้ได้อย่างไรว่าระบบหนึ่งดีกว่าอีกระบบหนึ่งอย่างมาก

1
กีฬาโอลิมปิก - ฮังการีมีตัวเลขสองหลักเป็นทองคำหรือไม่? (ญาติประชากร)
ฉันสร้างเว็บเพจที่ดึงผลลัพธ์ของเหรียญโอลิมปิกสดจาก Thompson Reuters และจำนวนประชากรทั่วโลกจาก CIA ผลลัพธ์น่าสนใจสำหรับฉัน - ฮังการีมีคะแนนนำสองหลักในเหรียญทองทั่วโลก นอกจากนี้สหรัฐอเมริกาและจีนก็อยู่ใกล้จุดต่ำสุดในเกือบทุกหมวดหมู่ คำถามของฉันคือ - ฉันกำลังนำเสนอข้อมูลอย่างเป็นธรรมหรือไม่? ฉันเอาประชากรที่มีขนาดใหญ่ที่สุดจากนั้นสร้างปัจจัยสำหรับแต่ละประเทศจากนั้น คอลัมน์การนับเหรียญสัมพันธ์จะขึ้นอยู่กับปัจจัยนั้น ฉันสามารถเพิ่มคอลัมน์ใดได้บ้าง ปัจจัยอื่นใดที่ฉันสามารถเพิ่มเพื่อนำเสนอมุมมองที่ยุติธรรม? มุมมองแบบสัมบูรณ์นั้นง่าย - รอยเตอร์ทำเช่นนั้น วิธีการสร้างมุมมองที่เป็นธรรม? https://rack.pub/rio

4
พัฒนาการทดสอบทางสถิติเพื่อแยกความแตกต่างของสองผลิตภัณฑ์
ฉันมีชุดข้อมูลจากแบบสำรวจลูกค้าฉันต้องการปรับใช้การทดสอบทางสถิติเพื่อดูว่ามีความแตกต่างอย่างมีนัยสำคัญระหว่างผลิตภัณฑ์ 1 และผลิตภัณฑ์ 2 หรือไม่ นี่คือชุดข้อมูลของความคิดเห็นของลูกค้า อัตรานี้แย่มากแย่มากโอเคดีถึงดีมาก customer product1 product2 1 very good very bad 2 good bad 3 okay bad 4 very good okay 5 bad very good 6 okay good 7 bad okay 8 very good very bad 9 good good 10 good very good 11 okay okay …

1
อะไรคือความแตกต่างระหว่าง "การทดสอบสมมติฐานทางสถิติที่ไม่มีสมมติฐาน" และแบบทดสอบอื่น ๆ
หัวข้อร้อนแรงล่าสุดของการอภิปรายเกี่ยวข้องกับวารสารห้ามการใช้ "ขั้นตอนการทดสอบทางสถิติสมมติฐานว่าง (NHSTPs)" จากบทความที่ส่งไปยังวารสาร ฉันเห็นคำนี้ที่นักเขียนบางคนใช้ แต่ฉันไม่เข้าใจว่าพวกเขากำลังพยายามสร้างความแตกต่างอะไร NHSTP นั้นแตกต่างจาก "การทดสอบสมมติฐาน" หรือ "การทดสอบนัยสำคัญ" หรือไม่?

1
จะตีความตัวแปรที่ถูกแยกออกจากหรือรวมอยู่ในรูปแบบ lasso ได้อย่างไร?
ฉันได้รับจากการโพสต์อื่น ๆ ว่าไม่มีความสำคัญ 'ความสำคัญ' หรือ 'ความสำคัญ' เพื่อทำนายตัวแปรที่เข้าสู่แบบจำลองเชือกเนื่องจากการคำนวณค่า p หรือค่าเบี่ยงเบนมาตรฐานของตัวแปรเหล่านั้นยังคงทำงานอยู่ ภายใต้การใช้เหตุผลนั้นถูกต้องหรือไม่ที่จะยืนยันว่าไม่สามารถพูดได้ว่าตัวแปรที่ถูกแยกออกจากตัวแบบเชือกเป็น 'ไม่เกี่ยวข้อง' หรือ 'ไม่สำคัญ'? ถ้าเป็นเช่นนั้นฉันสามารถเรียกร้องอะไรได้บ้างเกี่ยวกับตัวแปรที่ถูกแยกออกหรือรวมไว้ในแบบจำลองเชือก ในกรณีเฉพาะของฉันฉันเลือกแลมบ์ดาพารามิเตอร์การปรับแต่งโดยทำซ้ำการตรวจสอบความถูกต้องข้าม 10 เท่า 100 ครั้งเพื่อลด randonmess และเฉลี่ยโค้งข้อผิดพลาด UPDATE1: ฉันได้ทำตามคำแนะนำด้านล่างและเรียกใช้ lasso อีกครั้งโดยใช้ตัวอย่าง bootstrap ฉันได้ไปกับตัวอย่าง 100 รายการ (จำนวนนั้นเป็นสิ่งที่พลังคอมพิวเตอร์ของฉันสามารถจัดการข้ามคืนได้) และรูปแบบบางอย่างก็ปรากฏ 2 ใน 41 ตัวแปรของฉันเข้าสู่โมเดลมากกว่า 95% ของเวลา, 3 ตัวแปรมากกว่า 90% และ 5 ตัวแปรมากกว่า 85% ตัวแปร 5 ตัวนั้นเป็นหนึ่งใน 9 ที่เข้าสู่แบบจำลองเมื่อฉันรันด้วยตัวอย่างดั้งเดิมและเป็นตัวแปรที่มีค่าสัมประสิทธิ์สูงสุดแล้ว หากฉันใช้บ่วงบาศพร้อมกับตัวอย่าง …

2
ช่วงความมั่นใจแคบ ๆ เกี่ยวกับผลกระทบที่ไม่สำคัญสามารถแสดงหลักฐานว่าเป็นโมฆะ
เห็นได้ชัดว่าผิดพลาดที่จะคิดว่าความล้มเหลวในการปฏิเสธโมฆะก็หมายความว่าเป็นโมฆะ แต่ในกรณีที่เป็นโมฆะไม่ได้ปฏิเสธและช่วงความเชื่อมั่นที่สอดคล้องกัน (CI) เป็นที่แคบและแน่นิ่ง 0 นี้ไม่ได้ให้หลักฐานสำหรับโมฆะ? ฉันเป็นคนหนึ่งในใจสองคน: ใช่ในทางปฏิบัติสิ่งนี้จะแสดงหลักฐานว่าผลกระทบมีมากหรือน้อยกว่า 0 อย่างไรก็ตามในกรอบการทดสอบสมมุติฐานที่เข้มงวด ดังนั้นความหมายของ CI คืออะไรเมื่อการประเมินจุดของมันไม่สำคัญ? มันยังใช้ไม่ได้สำหรับการอนุมานหรือสามารถนำมาใช้ในตัวอย่างก่อนหน้านี้เพื่อหาปริมาณหลักฐานสำหรับโมฆะ? สนับสนุนคำตอบที่มีการอ้างอิงเชิงวิชาการ

1
จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร
สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

2
พารามิเตอร์การบูตแบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับรุ่นผสม
ตัดต่อไปนี้จะนำมาจากบทความนี้ ฉันเป็นมือใหม่ในการบู๊ตสแตรปและพยายามที่จะใช้การบู๊ตสแปปปิ้งแบบกึ่งพารามิเตอร์แบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับแบบจำลองเชิงเส้นผสมกับR bootแพ็คเกจ รหัส R นี่คือRรหัสของฉัน: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

1
วิธีการวัดความไม่แน่นอนเชิงสถิติ
ฉันค่อนข้างใหม่กับสถิติและเข้าใจว่าคำถามของฉันอาจผิดไปอย่างสิ้นเชิง ฉันกำลังทดสอบอัลกอริทึมของตัวเองกับที่อื่น ในขณะที่ผลลัพธ์ไม่เหมือนกันฉันต้องการแสดงให้เห็นว่าความแตกต่างนั้น "ไม่มีนัยสำคัญทางสถิติ" ฉันจะหาจำนวนนี้เพื่อทำให้ประเด็นของฉันได้อย่างไร

4
ทดสอบความแตกต่างอย่างมีนัยสำคัญในอัตราส่วนของตัวแปรสุ่มแบบกระจาย
เกี่ยวข้องกับการวิเคราะห์อัตราส่วนของตัวแปรและวิธีการกำหนดอัตราส่วนของตัวแปรที่มีการแจกแจงแบบปกติสองแบบหรือค่าผกผันของค่าใดค่าหนึ่ง . สมมติว่าฉันมีตัวอย่างจำนวนหนึ่งจากการแจกแจงแบบสุ่มอย่างต่อเนื่องที่แตกต่างกันสี่แบบซึ่งเราสามารถถือว่าเป็นเรื่องปกติได้ ในกรณีของฉันสิ่งเหล่านี้สอดคล้องกับตัวชี้วัดประสิทธิภาพของระบบไฟล์สองระบบที่แตกต่างกัน (เช่น ext4 และ XFS) ทั้งที่มีและไม่มีการเข้ารหัส ตัวอย่างเช่นเมตริกอาจเป็นจำนวนไฟล์ที่สร้างขึ้นต่อวินาทีหรือเวลาแฝงเฉลี่ยสำหรับการดำเนินการกับไฟล์บางอย่าง เราสามารถสรุปได้ว่าตัวอย่างทั้งหมดที่ได้จากการแจกแจงเหล่านี้จะเป็นผลบวกอย่างแน่นอน ขอเรียกกระจายเหล่านี้ที่และ\}Perffstype,encryptionPerffstype,encryption\textrm{Perf}_{fstype,encryption}fstype∈{xfs,ext4}fstype∈{xfs,ext4}fstype \in \{xfs,ext4\}encryption∈{crypto,nocrypto}encryption∈{crypto,nocrypto}encryption \in \{crypto,nocrypto\} ตอนนี้สมมติฐานของฉันคือการเข้ารหัสทำให้ระบบไฟล์ช้าลงโดยปัจจัยที่ใหญ่กว่าระบบอื่น มีการทดสอบอย่างง่าย ๆ สำหรับสมมติฐานE[Perfxfs,crypto]E[Perfxfs,nocrypto]&lt;E[Perfext4,crypto]E[Perfext4,nocrypto]E[Perfxfs,crypto]E[Perfxfs,nocrypto]&lt;E[Perfext4,crypto]E[Perfext4,nocrypto]\frac{E[\textrm{Perf}_{xfs,crypto}]}{E[\textrm{Perf}_{xfs,nocrypto}]} < \frac{E[\textrm{Perf}_{ext4,crypto}]}{E[\textrm{Perf}_{ext4,nocrypto}]} ?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.