อะไรคือความแตกต่างระหว่างสถิติเชิงพรรณนาและเชิงอนุมาน


21

ความเข้าใจของฉันคือสถิติเชิงพรรณนาอธิบายคุณลักษณะเชิงปริมาณของตัวอย่างข้อมูลในขณะที่สถิติเชิงอนุมานได้ทำการอนุมานเกี่ยวกับประชากรที่ตัวอย่างถูกวาดขึ้นมา

อย่างไรก็ตามหน้าวิกิพีเดียสำหรับสถานะการอนุมานทางสถิติ :

โดยส่วนใหญ่แล้วการอนุมานทางสถิติทำให้ข้อเสนอเกี่ยวกับประชากรโดยใช้ข้อมูลที่ดึงมาจากประชากรที่สนใจผ่านการสุ่มตัวอย่างบางรูปแบบ

"ส่วนใหญ่" ทำให้ฉันคิดว่าฉันอาจไม่เข้าใจแนวคิดเหล่านี้อย่างเหมาะสม มีตัวอย่างของสถิติเชิงอนุมานที่ไม่ได้ทำข้อเสนอเกี่ยวกับประชากรหรือไม่


สถิติเชิงพรรณนา: เหรียญถูกโยนสิบครั้งและลงมาหกครั้ง การอนุมานทางสถิติ: การประมาณความน่าจะเป็นสูงสุดของความน่าจะเป็นของหัวคือหรือข้อมูลนี้ไม่เพียงพอที่จะปฏิเสธสมมติฐานที่ว่าเหรียญเป็นเหรียญที่ยุติธรรม 0.6
Dilip Sarwate

2
การอนุมานที่ไม่มีแนวคิดของ "ประชากร": สมมติว่าข้อมูลของคุณสร้างขึ้นโดยกลไก / กฎแบบสุ่มบางส่วน (บางส่วน) ที่ไม่รู้จัก วิธีการอนุมานอนุญาตให้ประเมินคุณสมบัติของกลไกนี้ตามข้อมูล ตัวอย่าง: คุณต้องการตรวจสอบสูตรทางกายภาพและทางไฟฟ้าตามผลลัพธ์ที่สามารถวัดได้เพียงประมาณหรือภายใต้เงื่อนไขที่ไม่สมบูรณ์
Michael M

1
@Michael: ใช่; หรือทำให้ข้อมูลของคุณถูกสร้างขึ้นโดยกลไกสุ่มที่เป็นที่รู้จัก - การกำหนดแบบสุ่มของการรักษาทดลอง
Scortchi - Reinstate Monica

คำตอบ:


19

มาจากพื้นหลังวิทยาศาสตร์พฤติกรรมฉันเชื่อมโยงคำศัพท์นี้โดยเฉพาะกับตำราสถิติเบื้องต้น ในบริบทนี้ความแตกต่างคือ:

  • สถิติเชิงพรรณนา เป็นหน้าที่ของข้อมูลตัวอย่างที่น่าสนใจในการอธิบายคุณลักษณะของข้อมูล สถิติเชิงพรรณนาแบบคลาสสิกประกอบด้วยค่าเฉลี่ย, นาที, สูงสุด, ส่วนเบี่ยงเบนมาตรฐาน, ค่ามัธยฐาน, ความเบ้, ความโด่ง
  • สถิติเชิงอนุมานเป็นฟังก์ชันของข้อมูลตัวอย่างที่ช่วยให้คุณสามารถอนุมานเกี่ยวกับสมมติฐานเกี่ยวกับพารามิเตอร์ประชากร สถิติเชิงอนุมานแบบดั้งเดิม ได้แก่ z, t, , F-ratio ฯลฯχ2

จุดสำคัญคือสถิติใด ๆ อนุมานหรือพรรณนาเป็นฟังก์ชันของข้อมูลตัวอย่าง พารามิเตอร์คือฟังก์ชั่นของประชากรโดยที่คำว่าประชากรนั้นเหมือนกับการบอกกระบวนการสร้างข้อมูล

จากมุมมองนี้สถานะของฟังก์ชันที่กำหนดของข้อมูลเป็นสถิติเชิงพรรณนาหรือเชิงอนุมานขึ้นอยู่กับวัตถุประสงค์ที่คุณใช้งาน

ที่กล่าวว่าสถิติบางอย่างมีประโยชน์ชัดเจนกว่าในการอธิบายคุณสมบัติที่เกี่ยวข้องของข้อมูลและบางอย่างก็เหมาะสมกับการช่วยอนุมาน

  • สถิติเชิงอนุมาน: สถิติ ทดสอบมาตรฐานเช่น t และ z สำหรับกระบวนการสร้างข้อมูลที่กำหนดซึ่งสมมติฐานว่างเป็นเท็จค่าที่คาดหวังจะได้รับอิทธิพลอย่างมากจากขนาดตัวอย่าง นักวิจัยส่วนใหญ่จะไม่เห็นสถิติเช่นการประมาณค่าพารามิเตอร์ประชากรที่น่าสนใจภายใน
  • สถิติเชิงพรรณนา : ในทางตรงกันข้ามสถิติเชิงพรรณนาจะประมาณค่าพารามิเตอร์ของประชากรซึ่งโดยทั่วไปแล้วจะมีความสนใจภายใน ตัวอย่างเช่นค่าเฉลี่ยตัวอย่างและค่าเบี่ยงเบนมาตรฐานให้การประมาณค่าพารามิเตอร์ประชากรที่เทียบเท่ากัน แม้แต่สถิติเชิงพรรณนาเช่นค่าต่ำสุดและค่าสูงสุดให้ข้อมูลเกี่ยวกับพารามิเตอร์ประชากรที่เทียบเท่าหรือคล้ายกันถึงแม้ว่าในกรณีนี้จำเป็นต้องมีการดูแลที่มากขึ้น นอกจากนี้สถิติเชิงพรรณนาจำนวนมากอาจมีความลำเอียงหรือน้อยกว่าตัวประมาณในอุดมคติ อย่างไรก็ตามพวกเขายังมีโปรแกรมอรรถประโยชน์ในการประมาณค่าพารามิเตอร์ของประชากรที่น่าสนใจ

ดังนั้นจากมุมมองนี้สิ่งสำคัญที่ต้องเข้าใจคือ:

  • สถิติ : ฟังก์ชั่นของข้อมูลตัวอย่าง
  • พารามิเตอร์ : ฟังก์ชั่นของประชากร (กระบวนการสร้างข้อมูล)
  • ประมาณ : ฟังก์ชั่นของข้อมูลตัวอย่างที่ใช้ในการจัดทำประมาณการของพารามิเตอร์
  • การอนุมาน : กระบวนการถึงข้อสรุปเกี่ยวกับพารามิเตอร์

ดังนั้นคุณสามารถกำหนดความแตกต่างระหว่างการพรรณนาและเชิงอนุมานตามความตั้งใจของนักวิจัยโดยใช้สถิติหรือคุณสามารถกำหนดสถิติตามวิธีการใช้งานโดยทั่วไป


เป็นวิธีที่ถูกต้องหรือไม่ที่จะเรียกคะแนน t หรือ F (แทนที่จะเป็นแบบทดสอบทดสอบ ) สถิติที่อนุมาน?
jona

@ โจนาคะแนน t คือ "สถิติ" ที่ใช้ในการทดสอบ t ดังนั้นเราจึงสามารถอธิบายคะแนน t เป็นสถิติเชิงอนุมานได้เมื่อใช้เป็นส่วนหนึ่งของกระบวนการอนุมาน ฉันเดาว่าฉันได้เริ่มต้นด้วยการสันนิษฐานว่าสถิติเป็นหน้าที่ของข้อมูล แต่บางทีคุณอาจจะพูดถึงจุดที่เรามักจะนึกถึงสถิติเชิงอนุมานว่าเป็นเทคนิคที่ใช้ในการอนุมานที่กว้างขึ้น?
Jeromy Anglim

ขอผมใช้วลีนี้ต่างกัน - คำอธิบาย t-statistic ไม่ใช่ตัวอย่างแทนที่จะเป็นคำสั่งเชิงอนุมาน (เช่นค่า p)
jona

ใช่ฟังก์ชั่นของข้อมูลเทียบเท่ากับคำอธิบายของตัวอย่าง ฉันเดาว่าฉันคิดว่าสถิติดังกล่าวถูกนำมาใช้ในกระบวนการเชิงอนุมาน (เช่นนักวิจัยที่เกี่ยวข้องกับสถิติ t- การแจกแจงแบบ t เพื่อให้ได้ค่า p จากนั้นเชื่อมโยง p กับอัลฟ่าเพื่อทำการอนุมาน) ฉันมักจะเห็นตำราเรียนใช้ตัวอย่างเหล่านี้ แต่ฉันคิดว่า p-value และการอนุมานแบบไบนารีนั้นสามารถเห็นได้เป็นสถิติ (เช่นฟังก์ชั่นของข้อมูลตัวอย่าง) และการอนุมานแบบไบนารีนั้นสามารถมองเห็นได้อย่างชัดเจนที่สุดเมื่อเทียบกับการอนุมาน นั่นคือสิ่งที่คุณได้รับ
Jeromy Anglim

1
ตัวอย่างเช่นคุณใช้ข้อมูลเพื่อรับถึงtซึ่งเกี่ยวข้องกับการแจกแจงซึ่งให้ค่าpซึ่งจะให้ผลการอนุมานแบบไบนารีเกี่ยวกับพารามิเตอร์ประชากร ดังนั้นจากเปอร์สเปคทีฟบ่อยครั้ง, t, p, และการอนุมานไบนารีเป็นตัวแปรสุ่มทั้งหมด ทุกคนมีส่วนร่วมในกระบวนการอนุมาน ฉันไม่แน่ใจว่าข้อดีข้อเสียของการติดฉลากทั้งหมดหรือบางส่วนเท่านั้นเป็นสถิติที่อนุมาน
Jeromy Anglim

8

การอนุมานรูปแบบหนึ่งอยู่บนพื้นฐานของการกำหนดแบบสุ่มของการทดลองบำบัดและไม่ได้มาจากการสุ่มตัวอย่างจากประชากร (แม้แต่สมมุติฐาน) Oscar Kempthorneเป็นผู้สนับสนุน

ตัวอย่างแรกใน Edgington (1995) การทดสอบการสุ่มแสดงให้เห็นถึงวิธีการที่ดี นักวิจัยได้รับวิชาสิบแบ่งออกเป็นสองกลุ่มที่สุ่มจัดสรรรักษาให้เป็นหนึ่งในกลุ่ม &ไปที่อื่น ๆ มีขนาดการตอบสนองของพวกเขาและการคำนวณของนักเรียนเสื้อสถิติสำหรับความแตกต่างในกลุ่มหมายถึง แทนที่จะใช้ทฤษฎีการสุ่มตัวอย่างแบบปกติเพื่อประเมินความสำคัญเขาคำนวณสำหรับทุกวิธีที่เป็นไปได้ที่การรักษาอาจได้รับมอบหมาย (มี 252 ข้อ) จากนั้นเมื่อสังเกตว่าการเปลี่ยนแปลงแต่ละครั้งนั้นมีความเป็นไปได้อย่างเท่าเทียมกันภายใต้สมมติฐานว่างไม่มีผลการรักษาเขาเห็นว่าเก้าให้ค่าสูงกว่าที่สังเกตและคำนวณค่า p-valueB ทีที10 / 252 = 0.04ABtt10/252=0.04. "รับ" ที่นี่บ่อยครั้งอาจมีความหมายอะไรก็ได้ - บางทีนักศึกษาระดับปริญญาตรีสิบคนแรกในการบรรยายของเขาที่จะหยิบมือ - แต่ด้วยการวิเคราะห์นี้ไม่จำเป็นต้องรักษาข้ออ้างที่อาสาสมัครได้สุ่มตัวอย่างจาก ประชากรที่น่าสนใจ (ข้อเสียก็คือการวางนัยทั่วไปนอกเหนือจากสิบเหล่านี้คือสถิติพิเศษ)

การทำนายเป็นอีกพื้นที่หนึ่งที่คุณไม่จำเป็นต้องกำหนดข้อเสนอเกี่ยวกับประชากร (ผมไม่ทราบว่าทุกคนที่จะต้องการที่จะเรียกการคาดคะเน "อนุมาน" แต่มี Geisser (1993) Predictive อนุมาน: บทนำ ) การทำนายมักตามมาจากแบบจำลองประชากรที่เหมาะสม แต่ไม่เสมอไป เช่นตัวอย่างการจัดหมวดหมู่ของ @ Matt รูปแบบเฉลี่ย (Bayesian หรือน้ำหนัก Akaike) หรืออัลกอริทึมการพยากรณ์เช่นการปรับให้เรียบแบบเอ็กซ์โปเนนเชียล

NB ฉันคิดว่า "สถิติเชิงอนุมานกับสถิติเชิงพรรณนา" มักอ้างถึงสถิติของสาขามากกว่าที่จะคำนวณจากปริมาณตัวอย่าง ไม่มีความแตกต่างที่สำคัญระหว่างการอนุมานและสถิติเชิงพรรณนา @Jeremy ชี้ให้เห็นว่ามันเป็นเรื่องของการใช้งานที่คุณนำไปใช้


2

ฉันไม่แน่ใจว่าการจำแนกประเภทจำเป็นต้องมีคำสั่งเกี่ยวกับจำนวนประชากรที่จุดข้อมูลถูกดึงออกมา การจำแนกประเภทดังที่คุณอาจทราบว่าใช้ข้อมูลการฝึกอบรมประกอบด้วยเวกเตอร์ "ฟีเจอร์" บางอันแต่ละเลเบลพร้อมคลาสเฉพาะเพื่อทำนายเลเบลคลาสที่เป็นของเวกเตอร์คุณลักษณะที่ไม่มีป้ายกำกับอื่น ๆ ตัวอย่างเช่นเราอาจใช้สัญญาณชีพของผู้ป่วยและการวินิจฉัยของแพทย์เพื่อคาดการณ์ว่าผู้ป่วยรายอื่นมีสุขภาพดีหรือไม่ดี

ตัวแยกประเภทบางตัวเรียกว่า "ตัวแยกประเภทแบบกำเนิด" พยายามที่จะสร้างแบบจำลองประชากรหรือกระบวนการสร้างข้อมูลที่สร้างแต่ละชั้นอย่างชัดเจน ตัวอย่างเช่นอัลกอริทึม Naive Bayes คำนวณสำหรับแต่ละคลาสโดยถือว่าคุณสมบัตินั้นเป็นอิสระทั้งหมด แบบจำลองเหล่านี้อาจถูกมองว่าเป็นข้อความเกี่ยวกับประชากรอย่างสมเหตุสมผลP(class=c|features)c

อย่างไรก็ตามตัวแยกประเภทอื่น ๆ มองหาความแตกต่างระหว่างคลาสโดยไม่ต้องสร้างโมเดลคลาสเอง สิ่งเหล่านี้เรียกว่าลักษณนามจำแนก ตัวอย่างคลาสสิกอย่างหนึ่งคือตัวแยกประเภทเพื่อนบ้านที่ใกล้ที่สุดซึ่งกำหนดตัวอย่างที่ไม่มีชื่อให้กับคลาสของเพื่อนบ้านที่ใกล้เคียงที่สุด (โดยที่คำนิยามใกล้จะถูกกำหนดด้วยวิธีที่เหมาะสมสำหรับปัญหา) ดูเหมือนว่ามันจะมีข้อมูลเกี่ยวกับประชากรที่จุดข้อมูลถูกดึงออกมาไม่มากนัก

หากคุณสนใจในความแตกต่างระหว่างสถิติเชิงพรรณนาและเชิงอนุมานอาจเป็นประโยชน์มากกว่าที่จะคิดเกี่ยวกับจุดประสงค์ของการวิเคราะห์ สถิติเชิงพรรณนาเช่นค่าเฉลี่ยอาจบอกคุณได้ว่าเทราต์เลคจำนวนหนึ่งในทะเลสาบทั่วไป - พวกเขาอธิบายอะไรบางอย่าง สถิติเชิงอนุมานเช่น -test อาจบอกคุณได้ว่าโดยทั่วไปแล้วปลาเทราท์มากกว่าเบสในทะเลสาบเหล่านี้ - มันช่วยให้คุณสามารถอ้างสิทธิ์เกี่ยวกับสถิติเชิงพรรณนาt


0

ในหนึ่งบรรทัดจากข้อมูลสถิติเชิงพรรณนาพยายามสรุปเนื้อหาของข้อมูลของคุณด้วยการสูญเสียข้อมูลขั้นต่ำ (ขึ้นอยู่กับการวัดที่คุณใช้) คุณจะได้เห็นภูมิศาสตร์ของข้อมูล (เช่นดูกราฟประสิทธิภาพของชั้นเรียนและบอกว่าใครอยู่ด้านบนด้านล่างและอื่น ๆ )

ในหนึ่งบรรทัดให้ข้อมูลคุณพยายามที่จะประเมินและอนุมานถึงคุณสมบัติของประชากรสมมุติฐานซึ่งข้อมูลมาจาก (สิ่งที่ชอบทำความเข้าใจนักเรียนชั้นประถมศึกษาปีที่ 7 ผ่านตัวอย่างที่ดีจากชั้นเรียนโดยสมมติว่าประชากรพื้นฐานมีขนาดใหญ่พอที่คุณไม่สามารถนำมาพิจารณารวม


3
ฉันไม่คิดว่ามันเป็นคำจำกัดความหรือลักษณะของสถิติเชิงพรรณนาที่พวกเขาตั้งเป้าไว้ว่าจะสูญเสียข้อมูลน้อยที่สุด เป็นไปได้ทั้งหมดที่จะมีสถิติเชิงพรรณนาที่ไม่ได้ให้รายละเอียดที่สำคัญจริงๆและมักเป็นปัญหา
Nick Cox

0

ในระยะสั้น

สถิติเชิงพรรณนาเป็นการวิเคราะห์ข้อมูลที่อธิบายแสดงหรือสรุปข้อมูลด้วยความหมาย มันเป็นวิธีการอธิบายข้อมูลของเรา / พูดคุยเกี่ยวกับประชากรทั้งหมด บางคนเป็นมาตรการของแนวโน้มกลางและวัดการกระจายตัว

สถิติเชิงอนุมานเป็นเทคนิคที่ทำให้เราสามารถใช้ตัวอย่างเพื่อสร้างภาพรวมเกี่ยวกับประชากรที่กลุ่มตัวอย่างถูกดึงออกมาการทดสอบสมมติฐานตัวอย่างและ


0

สถิติเชิงพรรณนาเป็นการวิเคราะห์ข้อมูลที่อธิบายแสดงหรือสรุปข้อมูลด้วยความหมาย มันเป็นวิธีการอธิบายข้อมูลของเรา / พูดคุยเกี่ยวกับประชากรทั้งหมด บางคนเป็นมาตรการของแนวโน้มกลางและวัดการกระจายตัว

สถิติเชิงอนุมานเป็นเทคนิคที่ช่วยให้เราสามารถใช้ตัวอย่างเพื่อสร้างภาพรวมเกี่ยวกับประชากรที่กลุ่มตัวอย่างถูกดึงออกมาการทดสอบสมมติฐานตัวอย่างและแบ่งปันปรับปรุงคำตอบนี้


ยินดีต้อนรับสู่Cross Validated ! โปรดใช้เวลาสักครู่เพื่อดูของเราเกี่ยวกับการท่องเที่ยว ดูเหมือนว่าคุณกำลังจะได้คำตอบที่ดี แต่มีอะไรบางอย่างเกิดขึ้น อย่าลังเลที่จะแก้ไขคำตอบของคุณเพื่อทำให้ความคิดของคุณสมบูรณ์ คุณอาจต้องการปรับปรุงคำตอบของคุณโดยเพิ่มการอ้างอิง / การอ้างอิงซึ่งทำงานร่วมกันในสิ่งที่คุณได้ใส่ไว้ที่นี่ คุณต้องตอบคำถาม "มีตัวอย่างของสถิติเชิงอนุมานที่ไม่ได้ทำข้อเสนอเกี่ยวกับประชากรหรือไม่"
Tavrock
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.