ฉันเพิ่งรู้ว่ามีความแตกต่างในค่าเคิร์ตซีให้ SPSS และ Stata
ดูhttp://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm
ความเข้าใจของฉันคือการตีความที่เหมือนกันจึงจะแตกต่างกัน
คำแนะนำเกี่ยวกับวิธีการจัดการกับเรื่องนี้?
ฉันเพิ่งรู้ว่ามีความแตกต่างในค่าเคิร์ตซีให้ SPSS และ Stata
ดูhttp://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm
ความเข้าใจของฉันคือการตีความที่เหมือนกันจึงจะแตกต่างกัน
คำแนะนำเกี่ยวกับวิธีการจัดการกับเรื่องนี้?
คำตอบ:
โดยทั่วไปแล้วสามสูตรสำหรับ kurtosis ใช้โดยโปรแกรมที่แตกต่างกัน ฉันจะระบุสูตรทั้งสาม ( ,และ ) และโปรแกรมที่ใช้ G 2 b 2
สูตรแรกและความหมายทั่วไปที่ใช้ในตำราหลาย (นี้เป็นสูตรที่สองในการเชื่อมโยงที่คุณได้ให้) ที่หมายถึงช่วงเวลาตัวอย่าง : mr
บางครั้งคำแก้ไขของ -3 ถูกเพิ่มเข้ากับสูตรนี้เพื่อให้การแจกแจงแบบปกติมี kurtosis เท่ากับ 0 สูตรของ kurtosis ที่มีเงื่อนไขเท่ากับ -3 เรียกว่าเกินกำหนด (สูตรแรกในลิงก์ที่คุณให้ไว้)
สูตรที่สองเป็น (ใช้ SAS, SPSS และ MS Excel นี้เป็นสูตรที่สามในการเชื่อมโยงที่คุณได้ให้)
โดยที่คือ kurtosis ตามที่นิยามไว้ในสูตรแรก
สูตรที่สามถูก (ใช้ MINITAB และ BMDP)
โดยที่คือความแปรปรวนตัวอย่างแบบไม่เอนเอียง :
ในR
kurtosis สามารถคำนวณได้โดยใช้kurtosis
ฟังก์ชั่นจากe1071
แพคเกจ (ลิงค์ที่นี่ ) ตัวเลือกtype
จะกำหนดว่าหนึ่งในสามสูตรที่ใช้สำหรับการคำนวณ (1 = , 2 = , 3 = )G 2 b 2
เหล่านี้สองเอกสารหารือและเปรียบเทียบทั้งสามสูตร: ครั้งแรก , ครั้งที่สอง
ดูเพิ่มเติมที่หน้า Wikipediaและหน้า MathWorldเกี่ยวกับ kurtosis
ลิงก์ในคำถามพูดถึง SAS ด้วย แต่ในความเป็นจริงแล้วไม่มีอะไรในคำถามนี้นอกจากอาจเป็นจุดสนใจของผู้โพสต์ จำกัด เฉพาะรายการที่มีชื่อเฉพาะเหล่านั้น
ฉันคิดว่าเราจำเป็นต้องแยกแยะปัญหาที่แตกต่างกันออกไปที่นี่ซึ่งบางเรื่องเป็นภาพลวงตาและบางประเด็นเป็นเรื่องจริง
บางโปรแกรมทำและบางโปรแกรมไม่ลบ 3 เพื่อให้รายงานการวัด kurtosis เป็น 3 สำหรับตัวแปรเกาส์เซียน / ตัวแปรปกติโดยไม่ต้องลบและ 0 ที่มีการลบ ฉันเคยเห็นผู้คนงงงวยว่าบ่อยครั้งที่ความแตกต่างกลายเป็น 2.999 ไม่ใช่ 3
บางโปรแกรมใช้ปัจจัยการแก้ไขที่ออกแบบมาเพื่อให้แน่ใจว่าการประเมินความเคอร์โทซิสโดยปราศจากอคติ ปัจจัยการแก้ไขเหล่านี้เข้าใกล้ 1 เมื่อขนาดตัวอย่างขึ้น เนื่องจากไม่ได้รับการประเมินอย่างดีในกลุ่มตัวอย่างขนาดเล็ก แต่อย่างใดจึงไม่น่าเป็นห่วง
ดังนั้นจึงมีประเด็นเล็ก ๆ เกี่ยวกับสูตรอยู่ # 1 เป็นข้อตกลงที่ใหญ่กว่า # 2 แต่ทั้งคู่ก็น้อยหากเข้าใจ คำแนะนำอย่างชัดเจนคือดูเอกสารสำหรับโปรแกรมที่คุณใช้และหากไม่มีเอกสารอธิบายรายละเอียดชนิดนั้นให้ละทิ้งโปรแกรมนั้นทันที แต่กรณีทดสอบง่าย ๆ เช่นเดียวกับตัวแปร (1, 2) ให้ผลเป็น kurtosis 1 หรือ 4 ขึ้นอยู่กับอันดับ 1 เพียงอย่างเดียว (โดยไม่มีปัจจัยแก้ไข)
คำถามนั้นถามเกี่ยวกับการตีความ แต่นี่เป็นเรื่องที่เปิดกว้างและเป็นที่ถกเถียงกันมากขึ้น
ก่อนที่เราจะไปยังพื้นที่หลักของการสนทนาปัญหาที่มักจะได้รับการรายงาน แต่ไม่ค่อยเป็นที่รู้จักคือการประมาณค่าเคิร์ตซีนั้นถูก จำกัด ขอบเขตเป็นหน้าที่ของขนาดตัวอย่าง ฉันเขียนรีวิวใน Cox, NJ 2010 ข้อ จำกัด ของความเบ้ตัวอย่างและความโด่ง Stata Journal 10 (3): 482-495 http://www.stata-journal.com/article.html?article=st0204
บทคัดย่อ: ความเบ้และความหนาของตัวอย่างถูก จำกัด ด้วยฟังก์ชั่นขนาดตัวอย่าง ข้อ จำกัด หรือการประมาณของพวกเขาได้รับการค้นพบซ้ำหลายครั้งในช่วงหลายทศวรรษที่ผ่านมา แต่ดูเหมือนว่าจะยังคงเป็นที่รู้จักกันดีเท่านั้น ข้อ จำกัด นี้ให้ความลำเอียงในการประมาณค่าและในกรณีที่รุนแรงหมายความว่าไม่มีตัวอย่างใดที่สามารถเป็นพยานได้จริงถึงการกระจายของผู้ปกครอง ผลลัพธ์หลักถูกอธิบายในบทวิจารณ์การสอนและมันแสดงให้เห็นว่าอาจใช้ Stata และ Mata เพื่อยืนยันและสำรวจผลที่ตามมาได้อย่างไร
ตอนนี้ถึงสิ่งที่ถือกันโดยทั่วไปว่าเป็น nub ของเรื่อง:
หลายคนแปลว่าอาการคอเคซีสเป็นความแหลม แต่บางคนก็เน้นว่ามันมักจะทำหน้าที่เป็นเครื่องวัดน้ำหนักหาง ในความเป็นจริงการตีความทั้งสองอาจเป็นถ้อยคำที่สมเหตุสมผลสำหรับการแจกแจงบางอย่าง แทบจะหลีกเลี่ยงไม่ได้ที่ไม่มีการตีความวาจาอย่างง่ายของภาษาเคิร์ตซีส: ภาษาของเราไม่สมบูรณ์พอที่จะเปรียบเทียบผลรวมของพลังที่สี่ของการเบี่ยงเบนจากค่าเฉลี่ยและผลรวมของพลังที่สองของที่เหมือนกัน
ในคลาสสิกรองลงมาและมักถูกมองข้ามเออร์วิงก์แคปแลนสกี้ (1945a) ดึงความสนใจไปยังสี่ตัวอย่างของการแจกแจงที่มีค่าความแตกต่างของความโด่งและพฤติกรรมที่ไม่สอดคล้องกับการอภิปรายบางเรื่องของคอร์ติส
กระจายทุกคนมีความสมมาตรที่มีค่าเฉลี่ย 0 และความแปรปรวนที่ 1 และมีฟังก์ชั่นความหนาแน่นของตัวแปรและ ,c = √
kurtosis (ไม่มีการลบ) คือ (1) 2.75 (2) 3.125 (3) 4.5 (4) 8/3 2.667 : เปรียบเทียบค่าแบบเกาส์หรือค่าปกติ 3 ความหนาแน่นที่ค่าเฉลี่ยคือ (1) 0.423 (2) ) 0.387 (3) 0.470 (4) 0.366: เปรียบเทียบค่า Gaussian ที่ 0.399
เป็นคำแนะนำในการพล็อตความหนาแน่นเหล่านี้ ผู้ใช้ Stata สามารถดาวน์โหลดkaplansky
โปรแกรมของฉันจาก SSC การใช้สเกลลอการิทึมเพื่อความหนาแน่นอาจช่วยได้
ตัวอย่างเหล่านี้จะทำลายเรื่องราวที่เรียบง่ายที่ความโด่งต่ำหรือสูงมีการตีความที่ชัดเจนในแง่ของความแหลมหรือความแตกต่างอื่น ๆ
หากชื่อ Irving Kaplansky ส่งเสียงระฆังอาจเป็นเพราะคุณรู้จักงานของเขาในพีชคณิตสมัยใหม่ เขา (1917-2006) เป็นนักคณิตศาสตร์ชาวแคนาดา (ต่อมาอเมริกัน) และสอนและวิจัยที่ Harvard, Chicago และ Berkeley กับปีสงครามในกลุ่มคณิตศาสตร์ประยุกต์ของสภาป้องกันแห่งชาติที่มหาวิทยาลัยโคลัมเบีย Kaplansky ได้มีส่วนร่วมสำคัญในทฤษฎีกลุ่มทฤษฎีแหวนทฤษฎีของ algebras ผู้ประกอบการและทฤษฎีภาคสนาม เขาเป็นนักเปียโนและนักแต่งเพลงที่ประสบความสำเร็จและ expositor กระตือรือร้นและชัดเจนของคณิตศาสตร์ โปรดทราบถึงการมีส่วนร่วมอื่น ๆ ของความน่าจะเป็นและสถิติโดย Kaplansky (1943, 1945b) และ Kaplansky และ Riordan (1945)
Kaplansky, I. 1943 ลักษณะของการแจกแจงแบบปกติ พงศาวดารของคณิตศาสตร์สถิติ 14: 197-198
Kaplansky, I. 1945a ข้อผิดพลาดทั่วไปที่เกี่ยวข้องกับ kurtosis วารสารสมาคมสถิติอเมริกัน 40: 259 เท่านั้น
Kaplansky, I. 1945b การกระจายซีมโทติคของการวิ่งขององค์ประกอบต่อเนื่อง พงศาวดารของสถิติคณิตศาสตร์ 16: 200-203
Kaplansky, I. และ Riordan, J. 1945. การจับคู่หลายรายการและดำเนินการด้วยวิธีสัญลักษณ์ พงศาวดารของคณิตศาสตร์สถิติ 16: 272-277