มันสมเหตุสมผลไหมที่จะจัดการกับข้อมูลที่เป็นหมวดหมู่อย่างต่อเนื่อง?


57

ในการตอบคำถามนี้เกี่ยวกับข้อมูลที่ไม่ต่อเนื่องและต่อเนื่องฉันยืนยันอย่างชัดเจนว่ามันไม่ค่อยมีเหตุผลที่จะจัดการกับข้อมูลที่เป็นหมวดหมู่อย่างต่อเนื่อง

บนใบหน้าของมันที่ดูเหมือนชัดเจนในตัวเอง แต่ปรีชามักจะเป็นแนวทางที่ดีสำหรับสถิติหรืออย่างน้อยก็เป็นของฉัน ดังนั้นตอนนี้ฉันสงสัยว่า: จริงหรือ หรือมีการวิเคราะห์ที่สร้างขึ้นสำหรับการแปลงจากข้อมูลที่เป็นหมวดหมู่ไปเป็นบางส่วนที่มีประโยชน์จริง ๆ ? มันจะสร้างความแตกต่างได้ไหมถ้าข้อมูลนั้นเป็นอันดับ?


20
คำถามนี้และการตอบสนองทำให้เรานึกถึงว่าน้ำมันดิบและ จำกัด การแบ่งตัวแปรแบบโบราณในหมวดหมู่ - ลำดับ - ช่วงเวลา - อัตราส่วนจริงๆ มันสามารถชี้แนะทางสถิติที่ไร้เดียงสาได้ แต่สำหรับนักวิเคราะห์ที่มีประสบการณ์หรือคิดว่าเป็นสิ่งกีดขวางซึ่งเป็นอุปสรรคในการแสดงตัวแปรในรูปแบบที่เหมาะสมสำหรับข้อมูลและการตัดสินใจที่จะทำกับพวกเขา บางคนที่ทำงานจากมุมมองหลังนี้จะย้ายไปมาระหว่างการจัดหมวดหมู่ข้อมูลและ "ต่อเนื่อง" อย่างอิสระ สำหรับพวกเขาคำถามนี้ไม่สามารถเกิดขึ้นได้! แต่เราควรถามว่า: มันช่วยได้อย่างไร
whuber

@whuber (+1) อย่างน้อยที่สุดดูเหมือนว่าเป็นการยากที่จะเพิ่มความน่าเชื่อถือในการวัดและความแม่นยำในการวินิจฉัยในเวลาเดียวกัน
chl

คำตอบ:


34

ฉันจะสมมติว่าตัวแปร "เด็ดขาด" จริง ๆ แล้วหมายถึงตัวแปรอันดับ; มิฉะนั้นจะไม่มีความหมายมากนักที่จะถือว่ามันเป็นแบบต่อเนื่องเว้นแต่ว่าเป็นตัวแปรไบนารี (รหัส 0/1) ตามที่ @Rob ชี้ จากนั้นฉันจะบอกว่าปัญหาไม่ได้เป็นวิธีที่เราปฏิบัติต่อตัวแปรแม้ว่าแบบจำลองหลายอย่างสำหรับการวิเคราะห์ข้อมูลที่ได้รับการพัฒนาจนถึงตอนนี้ - ดูเช่นการวิเคราะห์ข้อมูลที่ได้รับคำสั่ง: ภาพรวมและการสำรวจล่าสุด การพัฒนาจาก Liu และ Agresti - มากกว่าระดับการวัดพื้นฐานที่เราถือว่า การตอบสนองของฉันจะเน้นไปที่ประเด็นที่สองนี้แม้ว่าฉันจะกล่าวถึงการกำหนดคะแนนเชิงตัวเลขให้กับหมวดหมู่หรือระดับตัวแปรสั้น ๆ

โดยการใช้การคำนวณตัวเลขแบบง่ายของตัวแปรอันดับคุณถือว่าสมมติว่าตัวแปรมีคุณสมบัติช่วงเวลา (ในแง่ของการจำแนกที่กำหนดโดย Stevens, 1946) จากมุมมองของทฤษฎีการวัด (ในด้านจิตวิทยา) นี่อาจเป็นข้อสันนิษฐานที่รุนแรงเกินไป แต่สำหรับการศึกษาขั้นพื้นฐาน (เช่นเมื่อมีการใช้รายการเดียวในการแสดงความคิดเห็นเกี่ยวกับกิจกรรมประจำวันที่มีถ้อยคำที่ชัดเจน) คะแนนเสียงเดียวใด ๆ . Cochran (1954) ชี้ไปที่แล้ว

ชุดคะแนนใด ๆ จะให้การ ทดสอบที่ถูกต้องโดยมีเงื่อนไขว่าจะสร้างขึ้นโดยไม่ปรึกษากับผลการทดสอบ หากชุดของคะแนนไม่ดีในการที่มันไม่ดีบิดเบือนระดับตัวเลขที่รองรับการจัดหมวดหมู่ที่สั่งซื้อจริงการทดสอบจะไม่สำคัญ คะแนนจึงควรรวบรวมข้อมูลเชิงลึกที่ดีที่สุดเกี่ยวกับวิธีการจัดหมวดหมู่ที่ถูกสร้างขึ้นและใช้ (หน้า 436)

(ขอบคุณมากที่ @whuber ที่เตือนฉันเกี่ยวกับเรื่องนี้ตลอดหนึ่งในความคิดเห็นของเขาซึ่งทำให้ฉันอ่านหนังสือของ Agresti อีกครั้งซึ่งการอ้างอิงนี้มาถึง)

อันที่จริงการทดสอบหลายรักษาตัวแปรโดยปริยายเช่นเครื่องชั่งน้ำหนักช่วงเวลา: ตัวอย่างเช่นสถิติสำหรับการทดสอบแนวโน้มเชิงเส้น (เป็นทางเลือกให้เป็นอิสระเรียบง่าย) จะขึ้นอยู่กับวิธีการหาความสัมพันธ์ ( , Agresti, 2002, p. 87)M 2 = ( n - 1 ) r 2M2M2=(n1)r2

นอกจากนี้คุณยังสามารถตัดสินใจที่จะถอดรหัสตัวแปรของคุณในช่วงที่ผิดปกติหรือรวมระดับของมันบางส่วน แต่ในกรณีนี้ความไม่สมดุลที่แข็งแกร่งระหว่างหมวดหมู่ที่ถูกถอดรหัสอาจบิดเบือนการทดสอบทางสถิติเช่นการทดสอบแนวโน้มดังกล่าว ทางเลือกที่ดีสำหรับการกำหนดระยะห่างระหว่างหมวดหมู่ได้ถูกเสนอโดย @Jeromy ซึ่งเป็นการปรับขนาดที่เหมาะสมที่สุด

ทีนี้มาพูดถึงประเด็นที่สองที่ฉันทำ ฉันลังเลอยู่เสมอเกี่ยวกับการเพิ่มแท็ก "psychometrics" เมื่อฉันเห็นคำถามแบบนี้เนื่องจากการสร้างและวิเคราะห์เครื่องชั่งวัดอยู่ภายใต้ทฤษฎี Psychometric (Nunnally และ Bernstein, 1994 เพื่อให้เข้าใจโดยรวม) ฉันจะไม่อยู่ในแบบจำลองทั้งหมดที่อยู่ภายใต้ทฤษฎีการตอบสนองของรายการและฉันขอแนะนำให้ผู้อ่านที่สนใจในแบบฝึกหัดของฉัน Partchev คู่มือการใช้ Visual เพื่อทฤษฎีการตอบสนองรายการสำหรับการแนะนำ IRT อย่างอ่อนโยนและการอ้างอิง (5-8) ที่ระบุไว้ท้ายที่สุดสำหรับ IRT taxonomies ที่เป็นไปได้ แนวคิดสั้น ๆ ก็คือว่าแทนที่จะกำหนดระยะทางตามอำเภอใจระหว่างหมวดหมู่ตัวแปรคุณถือว่าสเกลที่แฝงอยู่และประเมินตำแหน่งของมันในความต่อเนื่องนั้นพร้อมกับความสามารถหรือความรับผิดของแต่ละบุคคล ตัวอย่างง่ายๆคือสัญกรณ์ทางคณิตศาสตร์ที่มีมูลค่ามากดังนั้นให้พิจารณารายการต่อไปนี้ (มาจากแบบสอบถามคุณภาพชีวิตที่เกี่ยวข้องกับสุขภาพของEORTC QLQ-C30 ):

คุณเป็นห่วงไหม

ซึ่งเข้ารหัสในระดับสี่จุดตั้งแต่ "ไม่เลย" ถึง "มาก" คะแนนดิบคำนวณโดยการกำหนดคะแนน 1 ถึง 4 คะแนนในรายการที่อยู่ในระดับเดียวกันนั้นสามารถรวมเข้าด้วยกันเพื่อให้คะแนนระดับที่เรียกว่าซึ่งหมายถึงอันดับหนึ่งของโครงสร้างพื้นฐาน (ที่นี่องค์ประกอบสุขภาพจิต ) คะแนนสเกลที่สรุปดังกล่าวนั้นเป็นประโยชน์อย่างมากเนื่องจากการให้คะแนนความง่าย (สำหรับผู้ปฏิบัติงานหรือพยาบาล) แต่ไม่มีอะไรมากไปกว่าสเกลที่ไม่ต่อเนื่อง

นอกจากนี้เรายังสามารถพิจารณาได้ว่าความน่าจะเป็นของการรับรองหมวดหมู่การตอบสนองที่กำหนดนั้นเป็นไปตามรูปแบบโลจิสติกบางประเภทตามที่อธิบายไว้ในบทช่วยสอนของ I. Partchev ตามที่กล่าวไว้ข้างต้น โดยพื้นฐานแล้วความคิดคือรูปแบบของแบบจำลองขีด จำกัด (ซึ่งนำไปสู่การกำหนดที่เท่าเทียมกันในแง่ของแบบจำลองอัตราต่อรองแบบเป็นสัดส่วนหรือแบบสะสม) และเราจำลองแบบอัตราต่อรองของการอยู่ในหมวดหมู่การตอบสนองแบบเดียว บางประเภทโดยมีเงื่อนไขตามตำแหน่งของอาสาสมัครในลักษณะแฝง นอกจากนี้เราอาจกำหนดให้หมวดหมู่การตอบสนองมีระยะห่างเท่า ๆ กันในระดับแฝง (นี่คือโมเดลมาตราส่วนการให้คะแนน) - ซึ่งเป็นวิธีที่เราทำโดยการกำหนดคะแนนตัวเลขที่เว้นระยะสม่ำเสมอ - หรือไม่ (นี่คือโมเดลเครดิตบางส่วน) .

เห็นได้ชัดว่าเราไม่ได้เพิ่มทฤษฎีการทดสอบแบบคลาสสิกมากนักโดยที่ตัวแปรลำดับจะถือว่าเป็นตัวเลข อย่างไรก็ตามเราแนะนำแบบจำลองความน่าจะเป็นที่ซึ่งเราถือว่าสเกลต่อเนื่อง (พร้อมคุณสมบัติช่วงเวลา) และที่ข้อผิดพลาดเฉพาะของการวัดสามารถนำมาคิดรวมกันได้และเราสามารถเสียบคะแนนแฟคทอเรียลเหล่านี้ในแบบจำลองการถดถอย

อ้างอิง

  1. SS Stevens เกี่ยวกับทฤษฎีการชั่งตวงวัด วิทยาศาสตร์ , 103 : 677-680, 1946
  2. WG Cochran วิธีการบางอย่างในการเสริมสร้างการทั่วไป ชีว , 10 : 417-451, 1954χ2
  3. J Nunnally และ I Bernstein ทฤษฎีไซโครเมทริกซ์ McGraw-Hill, 1994
  4. Alan Agresti วิเคราะห์ข้อมูลเด็ดขาด ไวลีย์ 2533
  5. CR Rao และ S Sinharay บรรณาธิการ คู่มือสถิติฉบับ 26: Psychometrics Elsevier Science BV, เนเธอร์แลนด์, 2007
  6. Boomsma, MAJ van Duijn, และ Snijders TAB บทความเกี่ยวกับทฤษฎีการตอบสนองข้อสอบ Springer, 2001
  7. D Thissen และ L Steinberg taxonomy ของโมเดลการตอบกลับไอเท็ม Psychometrika , 51 (4) : 567–577, 1986
  8. P Mair และ R Hatzinger ขยาย Rasch การสร้างแบบจำลองที่: ERM แพคเกจสำหรับการประยุกต์ใช้ IRT รุ่นใน R วารสารซอฟต์แวร์เชิงสถิติ , 20 (9) , 2007

19

หากมีเพียงสองหมวดหมู่ให้เปลี่ยนเป็น (0,1) อย่างสมเหตุสมผล อันที่จริงแล้วสิ่งนี้จะกระทำกันโดยทั่วไปซึ่งใช้ตัวแปรตัวจำลองผลลัพธ์ในตัวแบบการถดถอย

หากมีมากกว่าสองหมวดหมู่ฉันคิดว่ามันสมเหตุสมผลถ้าข้อมูลนั้นเป็นลำดับและเฉพาะในสถานการณ์ที่เฉพาะเจาะจงเท่านั้น ตัวอย่างเช่นถ้าฉันกำลังถดถอยและพอดีกับฟังก์ชั่นที่ไม่ใช่เชิงพารามิเตอร์กับตัวแปรลำดับเลขลำดับฉันคิดว่าไม่เป็นไร แต่ถ้าฉันใช้การถดถอยเชิงเส้นจากนั้นฉันจะตั้งสมมติฐานที่แข็งแกร่งมากเกี่ยวกับความแตกต่างสัมพัทธ์ระหว่างค่าต่อเนื่องของตัวแปรลำดับและฉันมักจะลังเลที่จะทำเช่นนั้น


1
"[T] ไก่ฉันกำลังตั้งสมมติฐานที่แข็งแกร่งมากเกี่ยวกับความแตกต่างสัมพัทธ์ระหว่างค่าต่อเนื่องของตัวแปรลำดับ" ฉันคิดว่านี่เป็นจุดสำคัญจริง ๆ นั่นคือวิธีที่คุณสามารถยืนยันได้อย่างชัดเจนว่าความแตกต่างระหว่างกลุ่ม 1 และ 2 นั้นเปรียบได้กับกลุ่มระหว่าง 2 และ 3 หรือไม่?
Freya Harrison

ฉันคิดว่าคุณควรตั้งสมมติฐานเกี่ยวกับวิธีกระจายตัวแปรอย่างต่อเนื่องแล้วลองปรับให้เหมาะสมกับ "psudohistogram" นี้ของความถี่ตัวแปรเด็ดขาดแต่ละอัน (ฉันหมายถึงค้นหาความกว้างของช่องเก็บ ถึงกระนั้นฉันไม่ได้เป็นผู้เชี่ยวชาญในด้านนี้มันเป็นความคิดที่รวดเร็วและสกปรก

การจัดหมวดหมู่ไบนารีใหม่อีกครั้งเมื่อ {0,1} เข้าท่า แต่การเปลี่ยนให้อยู่ในช่วง [0,1] ต่อเนื่องนั้นดูเหมือนจะเป็นการก้าวกระโดด ที่ด้านหน้าที่กว้างขึ้นฉันเต็มไปด้วยความฝืนใจของคุณต่อกฎน้ำหนักเท่า ๆ กันเว้นแต่จะมีข้อโต้แย้งที่ทรงพลังจากโมเดล
walkytalky

18

มันเป็นเรื่องธรรมดาที่จะจัดการกับตัวแปรเด็ดขาดสั่งด้วยหลายประเภทอย่างต่อเนื่อง ตัวอย่างของสิ่งนี้:

  • จำนวนรายการที่ถูกต้องในการทดสอบ 100 รายการ
  • มาตรวัดทางจิตวิทยาที่สรุปแล้ว (เช่นนั่นคือค่าเฉลี่ย 10 รายการในระดับคะแนนห้า)

และโดย "ปฏิบัติต่อเนื่อง" ฉันหมายถึงการรวมตัวแปรในแบบจำลองที่ถือว่าตัวแปรสุ่มต่อเนื่อง (เช่นเป็นตัวแปรตามในการถดถอยเชิงเส้น) ฉันคิดว่าปัญหาคือต้องใช้คะแนนสเกลจำนวนเท่าไหร่เพื่อให้เป็นข้อสมมติฐานที่ทำให้เข้าใจง่าย

ความคิดอื่น ๆ ไม่กี่:

  • ความสัมพันธ์แบบ Polychoricพยายามที่จะสร้างแบบจำลองความสัมพันธ์ระหว่างตัวแปรลำดับสองในแง่ของตัวแปรต่อเนื่องแฝงสันนิษฐาน
  • การปรับขนาดที่เหมาะสมช่วยให้คุณสามารถพัฒนาแบบจำลองที่การปรับขนาดของตัวแปรเด็ดขาดได้รับการพัฒนาในลักษณะที่ขับเคลื่อนด้วยข้อมูลในขณะที่ปฏิบัติตามข้อ จำกัด ของขนาดที่คุณกำหนด (เช่นกฎทั่วไป) สำหรับการแนะนำที่ดีให้ดูที่ De Leeuw and Mair (2009)

อ้างอิง

  • De Leeuw, J. , & Mair, P. (2009) วิธีการ Gifi สำหรับการปรับขนาดที่เหมาะสมที่สุดใน R: แพคเกจ homals วารสารซอฟต์แวร์เชิงสถิติ, กำลังจะมาถึง, 1-30. รูปแบบไฟล์ PDF

7

ตัวอย่างง่ายๆที่มักถูกมองข้ามซึ่งควรอยู่ในประสบการณ์ของผู้อ่านหลายคนเกี่ยวกับเครื่องหมายหรือเกรดที่ให้กับงานวิชาการ บ่อยครั้งที่เครื่องหมายสำหรับการมอบหมายส่วนบุคคลนั้นอยู่ในการวัดตามลำดับการตัดสินที่สำคัญแม้เมื่อเป็นเรื่องของการประชุมพวกเขาจะได้รับเครื่องหมาย (พูด) เปอร์เซ็นต์หรือเครื่องหมายในระดับสูงสุด 5 (อาจมีจุดทศนิยมเช่นกัน) นั่นคือครูอาจอ่านเรียงความหรือวิทยานิพนธ์หรือวิทยานิพนธ์หรือกระดาษและตัดสินใจว่าสมควรได้รับ 42% หรือ 4 หรืออะไรก็ตาม แม้ว่าเครื่องหมายจะอยู่บนพื้นฐานของรูปแบบการประเมินโดยละเอียดสเกลจะอยู่ที่ระยะทางจากช่วงเวลาหรืออัตราส่วนการวัดอัตราส่วน

แต่หลายสถาบันมีความเห็นว่าถ้าคุณมีคะแนนหรือคะแนนเพียงพอแล้วมันสมเหตุสมผลอย่างยิ่งที่จะเฉลี่ยพวกเขา (คะแนนเฉลี่ยเกรดเป็นต้น) และแม้กระทั่งการวิเคราะห์รายละเอียดเพิ่มเติม ดังนั้นในบางจุดการวัดตามลำดับจะแปรเปลี่ยนเป็นสเกลสรุปที่ถือว่าราวกับว่ามันต่อเนื่อง

ผู้ที่ชื่นชอบการประชดจะทราบว่าหลักสูตรสถิติในหลายหน่วยงานหรือโรงเรียนมักจะสอนว่านี่เป็นพิรุธที่ดีที่สุดและผิดที่เลวร้ายที่สุดทั้งหมดในขณะที่มันถูกนำมาใช้เป็นขั้นตอนทั่วทั้งมหาวิทยาลัย


5

ในการวิเคราะห์การจัดอันดับโดยความถี่เช่นเดียวกับแผนภูมิ Pareto และค่าที่เกี่ยวข้อง (เช่นจำนวนหมวดหมู่ที่ประกอบขึ้นเป็น 80% ของความผิดพลาดของผลิตภัณฑ์สูงสุด)


5
จุดสำคัญและสามารถขยายได้: โมเดลหลายรุ่นสำหรับบานพับข้อมูลอันดับที่อยู่บนแนวคิดที่ว่าไม่ใช่ข้อมูลลำดับ แต่เป็นความน่าจะเป็นสะสมที่สามารถจำลองได้
Nick Cox

4

ฉันจะโต้แย้งว่าการรักษาตัวแปรที่ไม่มีหมวดหมู่อย่างแท้จริงอย่างต่อเนื่องในบางครั้งอาจทำให้รู้สึกได้

หากคุณกำลังสร้างแผนผังการตัดสินใจตามชุดข้อมูลขนาดใหญ่อาจมีค่าใช้จ่ายสูงในแง่ของพลังการประมวลผลและหน่วยความจำในการแปลงตัวแปรเด็ดขาดเป็นตัวแปรจำลอง นอกจากนี้บางรุ่น (เช่นrandomForestใน R) ไม่สามารถจัดการตัวแปรเด็ดขาดที่มีหลายระดับ

ในกรณีเหล่านี้แบบจำลองที่มีโครงสร้างเป็นต้นไม้ควรจะสามารถระบุหมวดหมู่ที่สำคัญอย่างยิ่งแม้ว่าจะถูกเข้ารหัสเป็นตัวแปรต่อเนื่อง ตัวอย่างที่วางแผนไว้:

set.seed(42)
library(caret)
n <- 10000
a <- sample(1:100, n, replace=TRUE)
b <- sample(1:100, n, replace=TRUE)
e <- runif(n)
y <- 2*a + 1000*(b==7) + 500*(b==42) + 1000*e
dat1 <- data.frame(y, a, b)
dat2 <- data.frame(y, a, b=factor(b))

y เป็นตัวแปรต่อเนื่อง a เป็นตัวแปรต่อเนื่องและ b เป็นตัวแปรเด็ดขาด อย่างไรก็ตามในdat1b จะถือว่าต่อเนื่อง

ติดตั้งโครงสร้างการตัดสินใจกับชุดข้อมูล 2 ชุดนี้เราพบว่าdat1แย่กว่าdat2:

model1 <- train(y~., dat1, method='rpart')
model2 <- train(y~., dat2, method='rpart')
> min(model1$results$RMSE)
[1] 302.0428
> min(model2$results$RMSE)
[1] 294.1411

หากคุณดูทั้ง 2 รุ่นคุณจะพบว่ามันคล้ายกันมาก แต่ model1 พลาดความสำคัญของ b == 42:

> model1$finalModel
n= 10000 

node), split, n, deviance, yval
      * denotes terminal node

 1) root 10000 988408000  614.0377  
   2) a< 42.5 4206 407731400  553.5374 *
   3) a>=42.5 5794 554105700  657.9563  
     6) b>=7.5 5376 468539000  649.2613 *
     7) b< 7.5 418  79932820  769.7852  
      14) b< 6.5 365  29980450  644.6897 *
      15) b>=6.5 53   4904253 1631.2920 *
> model2$finalModel
n= 10000 

node), split, n, deviance, yval
      * denotes terminal node

 1) root 10000 988408000  614.0377  
   2) b7< 0.5 9906 889387900  604.7904  
     4) a< 42.5 4165 364209500  543.8927 *
     5) a>=42.5 5741 498526600  648.9707  
      10) b42< 0.5 5679 478456300  643.7210 *
      11) b42>=0.5 62   5578230 1129.8230 *
   3) b7>=0.5 94   8903490 1588.5500 *

อย่างไรก็ตาม model1 รันในเวลาประมาณ 1/10 ของเวลาของ model2:

> model1$times$everything
   user  system elapsed 
  4.881   0.169   5.058 
> model2$times$everything
   user  system elapsed 
 45.060   3.016  48.066 

แน่นอนคุณสามารถปรับแต่งค่าพารามิเตอร์ของปัญหาที่จะหาสถานการณ์ที่dat2มีประสิทธิภาพเหนือกว่าไกลdat1หรือเล็กน้อยมีประสิทธิภาพดีกว่าdat1dat2

ฉันไม่ได้สนับสนุนให้มีการจัดหมวดหมู่ตัวแปรอย่างต่อเนื่อง แต่ฉันได้พบสถานการณ์ที่การทำเช่นนั้นได้ลดเวลาลงอย่างมากเพื่อให้พอดีกับแบบจำลองของฉันโดยไม่ลดความแม่นยำในการทำนายลง


3

บทสรุปที่ดีมากของหัวข้อนี้สามารถพบได้ที่นี่:

mijkerhemtulla.socsci.uva.nl PDF

"เมื่อใดที่ตัวแปรหมวดหมู่จะได้รับการปฏิบัติอย่างต่อเนื่องการเปรียบเทียบวิธีการประมาณค่า SEM อย่างต่อเนื่องและหมวดหมู่ที่แข็งแกร่งภายใต้เงื่อนไขย่อยที่เหมาะสมที่สุด"

Mijke Rhemtulla, Patricia É. Brosseau-Liard และ Victoria Savalei

พวกเขาตรวจสอบวิธีการที่มีมูลค่าถึง 60 หน้าสำหรับการทำเช่นนั้นและให้ข้อมูลเชิงลึกเกี่ยวกับเวลาที่มีประโยชน์ในการทำวิธีการที่จะทำและจุดแข็งและจุดอ่อนของแต่ละวิธีเพื่อให้เหมาะสมกับสถานการณ์เฉพาะของคุณ พวกเขาไม่ได้ครอบคลุมพวกเขาทั้งหมด (ขณะที่ฉันกำลังเรียนรู้ดูเหมือนว่าจะมีจำนวนไม่ จำกัด ) แต่สิ่งที่พวกเขาครอบคลุมพวกเขาครอบคลุมดี


2

มีอีกกรณีหนึ่งที่เหมาะสม: เมื่อข้อมูลถูกสุ่มตัวอย่างจากข้อมูลต่อเนื่อง (ตัวอย่างเช่นผ่านตัวแปลงอนาล็อกเป็นดิจิตอล) สำหรับเครื่องมือรุ่นเก่า ADCs มักจะเป็น 10 บิตให้ข้อมูลลำดับที่ 1024 หมวดหมู่ แต่สามารถสำหรับวัตถุประสงค์ส่วนใหญ่ถือว่าเป็นจริง (แม้ว่าจะมีบางสิ่งประดิษฐ์สำหรับค่าใกล้ระดับต่ำสุดของมาตราส่วน) วันนี้ ADCs เป็นมากกว่า 16 หรือ 24 บิต เมื่อคุณพูดถึง 65536 หรือ 16777216 "หมวดหมู่" คุณไม่มีปัญหาในการจัดการข้อมูลอย่างต่อเนื่อง


ฉันเห็นด้วยอย่างยิ่งกับบรรทัดล่างสุดของคุณ แต่เนื้อหาดังกล่าวไม่เคยมีลำดับที่จะเริ่มต้นเพียงแค่แยกออก ทรีทเม้นต์ Lousy ของ nominal-ordinal-interval-ratio จะถูกตำหนิที่นี่เพราะมักจะไม่ได้ชี้ให้เห็นว่าลำดับที่แสดงถึงการแยก แต่ไม่ใช่ในทางกลับกัน การนับเป็นลำดับ แต่เป็นช่วงและอัตราส่วนด้วย
Nick Cox

@Nick Ordinal บอกเป็นนัย ๆ ? ไม่จำเป็น. มาตรการต่อเนื่องสามารถเป็นลำดับ ตัวอย่างเช่นตัวแปรทางสรีรวิทยาเช่น GSP หรืออัตราการเต้นของหัวใจมีความต่อเนื่อง แต่เป็นมาตรการของตัวแปรทางจิตวิทยาเช่นความวิตกกังวลหรือเร้าอารมณ์พวกเขาเป็นเพียงลำดับ ความคิดเกี่ยวกับลำดับเวลาและช่วงเวลาจริงๆหมายถึงความเป็นเส้นตรงของฟังก์ชันที่เกี่ยวข้องกับการวัดกับสิ่งที่มันตั้งใจจะวัด
Ray Koopman

นั่นเป็นคำพูดที่น่าสนใจ แต่เมื่อคุณเข้ามาในดินแดนนั้นฉันไม่เห็นว่าคุณจะจำแนกอัตราการเต้นของหัวใจได้อย่างไรโดยไม่มีหลักฐานว่าความวิตกกังวลเป็นอย่างไรและในที่สุดตัวแปรส่วนใหญ่ที่ถือว่าเป็นพร็อกซี่นั้นไม่สามารถจำแนกได้ คุณจะใช้ทุกวิธีในการปฏิเสธที่จะใช้วิธีการสำหรับข้อมูลช่วงเวลาหรืออัตราส่วนเมื่อใดก็ตามที่คุณเปลี่ยนไปเกี่ยวกับมาตราส่วนการวัดเป็นเพียงลำดับ ฉันไม่คิดว่าข้อมูลจะทำงานแตกต่างไปจากสิ่งที่คุณตั้งใจจะทำกับพวกเขา นั่นคือปัญหาของฉัน
Nick Cox

1
@Nick คำถามคือว่าฟังก์ชั่นที่เกี่ยวข้องกับค่าที่วัดได้กับค่า "จริง" นั้นใกล้เคียงกับเส้นตรงมากพอที่จะทำให้มันเป็นเช่นนั้นจะไม่นำไปสู่ข้อสรุปที่ไม่ถูกต้องหรือไม่ มักจะมีข้อมูลที่น้อยมากหรือไม่มีเลยที่จะใช้ตัดสินใจ มันจะเป็นการตัดสินที่มักจะเกี่ยวกับการที่คนฉลาดแจ้งให้ทราบอาจต้องเห็นด้วยที่จะไม่เห็นด้วย
Ray Koopman

1
ฉันคิดว่าการสนทนาตามปกติของการวัดตาชั่งในสถิติอยู่ที่คุณสมบัติทางคณิตศาสตร์ของตัวแปรและการดำเนินการทางคณิตศาสตร์ที่ถูกต้องตามกฎหมายสำหรับแต่ละ นั่นเป็นที่ถกเถียงกันพอสมควร ความกังวลทางวิทยาศาสตร์ว่าการวัดสิ่งที่ฉันควรจะเห็นว่าสำคัญอย่างสำคัญหรือไม่ แต่ฉันเห็นว่าเป็นประเด็นถกเถียงที่ต่างออกไป
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.