ความเป็นส่วนตัวในสถิติผู้ใช้บ่อย


14

ฉันมักจะได้ยินคำกล่าวอ้างว่าสถิติแบบเบย์นั้นเป็นเรื่องส่วนตัว เหตุผลหลักคือการอนุมานนั้นขึ้นอยู่กับการเลือกก่อนหน้า (แม้ว่าใครจะสามารถใช้หลักการของความไม่แยแส o สูงสุดของเอนโทรปีในการเลือกก่อน) ในการเปรียบเทียบการเรียกร้องไปสถิติบ่อยครั้งโดยทั่วไปมีวัตถุประสงค์มากขึ้น คำนี้มีความจริงมากน้อยแค่ไหน?

นอกจากนี้ยังทำให้ฉันสงสัย:

  1. อะไรคือองค์ประกอบที่เป็นรูปธรรมของสถิติผู้ใช้บ่อย (ถ้ามี) ที่สามารถเป็นอัตนัยโดยเฉพาะและที่ไม่ปรากฏหรือมีความสำคัญน้อยกว่าในสถิติแบบเบย์?
  2. ความเป็นส่วนตัวนั้นแพร่หลายมากในเบย์มากกว่าในสถิติบ่อย

5
แน่นอนว่าวิธีการที่ใช้บ่อยเป็นเรื่องส่วนตัวมากกว่าการโฆษณา แต่ฉันขอยืนยันว่าวิธีการแบบเบย์นั้นยังคงเป็นอัตวิสัยมากกว่า และโปรดอย่าโน้มน้าวตัวคุณเองว่าค่าคงที่ของคุณก่อนหน้าภายใต้กลุ่มหรือข้อกำหนดของ MaxEnt ก่อนเป็นอย่างใด "วัตถุประสงค์" - ทั้งสองประเภทก่อนอาจแสดงความเชื่อที่ฉันพิจารณาข้อมูลและในอัตราใด ๆ กลยุทธ์ไม่สามารถใช้ได้ในทั่วไป (เช่นฉันไม่คิดว่าจะมีค่าคงที่หรือค่าสูงสุดของ MaxEnt บนพื้นที่ของ CDF และสิ่งใด ๆ ก่อนหน้านี้ในพื้นที่นี้จะกำหนดความน่าจะเป็น 1 ให้กับชุดของการขาดแคลนทางโทโพโลยี)
คนที่แต่งตัวประหลาด

2
Bayesians เริ่มต้นบนพื้นส่วนตัวแล้วข้อมูล (หวังว่า) ดึงพวกเขากลับเข้าไปในความเป็นจริงวัตถุประสงค์ บ่อยครั้งที่ผู้เริ่มต้น (หรืออย่างน้อยก็คิดว่าพวกเขาทำ) จากตำแหน่งที่เป็นวัตถุประสงค์ แต่จากนั้นพวกเขาก็สรุปการวิเคราะห์ด้วยสมมติฐานส่วนตัวของพวกเขา
Aksakal

2
Bayesians ทั้งรู้และอยู่ข้างหน้ากับสมมติฐานของพวกเขา ผู้ที่พบบ่อยเป็นประจำไม่ใช่
Alexis

คำตอบ:


15

ฉันมักจะได้ยินคำกล่าวอ้างว่าสถิติแบบเบย์นั้นเป็นเรื่องส่วนตัว

ฉันก็เช่นเดียวกัน แต่สังเกตว่ามีความคลุมเครือที่สำคัญในการเรียกบางสิ่งบางอย่าง

ความเป็นส่วนตัว (ทั้งประสาทสัมผัส)

อัตนัยสามารถหมายถึง (อย่างน้อย) หนึ่งใน

  1. ขึ้นอยู่กับลักษณะนิสัยของนักวิจัย
  2. เกี่ยวข้องอย่างชัดเจนกับสถานะของความรู้ของบุคคล

Bayesianism เป็นอัตนัยในความหมายที่สองเพราะมันมักจะเสนอวิธีในการปรับปรุงความเชื่อที่เป็นตัวแทนของการกระจายความน่าจะเป็นโดยการปรับเงื่อนไขในข้อมูล (โปรดทราบว่าความเชื่อเหล่านั้นเป็นความเชื่อที่ว่าบางเรื่องมีจริงหรือเพียงแค่เชื่อว่าเรื่องนั้นอาจไม่เกี่ยวข้องกับการตัดสินใจว่ามันเป็น 'อัตนัย')

เหตุผลหลักคือการอนุมานนั้นขึ้นอยู่กับการเลือกของก่อน

ที่จริงแล้วหากก่อนหน้านี้แสดงถึงความเชื่อส่วนตัวของคุณเกี่ยวกับบางสิ่งบางอย่างคุณแทบจะไม่ได้เลือกสิ่งใดเกินกว่าที่คุณเลือกความเชื่อส่วนใหญ่ของคุณ และถ้ามันแสดงถึงความเชื่อของใครบางคนมันอาจเป็นการแสดงถึงความเชื่อเหล่านั้นได้อย่างแม่นยำมากขึ้นหรือน้อยลงดังนั้นดังนั้นความคิดเชิงประชดประชันจะมีข้อเท็จจริงที่ค่อนข้าง 'เกี่ยวกับ' ว่ามันเป็นตัวแทนของพวกเขาได้ดีเพียงใด

(แม้ว่าใครจะสามารถใช้หลักการของความไม่แยแส o สูงสุดเอนโทรปีในการเลือกก่อน)

อย่างใดอย่างหนึ่งได้ แต่สิ่งนี้ไม่ได้มีแนวโน้มที่จะพูดคุยอย่างราบรื่นมากกับโดเมนต่อเนื่อง นอกจากนี้ยังเป็นไปไม่ได้ที่จะแบนหรือ 'ไม่สนใจ' ในการปรับพารามิเตอร์ทั้งหมดในคราวเดียว (แม้ว่าฉันไม่แน่ใจว่าทำไมคุณถึงต้องการ)

ในการเปรียบเทียบการเรียกร้องไปสถิติบ่อยครั้งโดยทั่วไปมีวัตถุประสงค์มากขึ้น คำนี้มีความจริงมากน้อยแค่ไหน?

ดังนั้นเราจะประเมินการอ้างสิทธิ์นี้ได้อย่างไร

ฉันขอแนะนำว่าในความรู้สึกที่สองของความรู้สึกส่วนตัว: มันถูกต้องเป็นส่วนใหญ่ และในความรู้สึกแรกของอัตนัย: มันอาจจะผิด

บ่อยครั้งเป็นอัตนัย (ความรู้สึกที่สอง)

รายละเอียดทางประวัติศาสตร์บางอย่างมีประโยชน์ในการแมปปัญหา

สำหรับเนย์แมนและเพียร์สันมีเพียงพฤติกรรมอุปนัยที่ไม่ได้อนุมานเชิงอุปนัยและการประเมินทางสถิติทั้งหมดทำงานกับคุณสมบัติการสุ่มตัวอย่างในระยะยาวของเครื่องประมาณ (ดังนั้นการวิเคราะห์อัลฟาและกำลัง แต่ไม่ได้ค่า p) มันค่อนข้างไม่น่าสงสัยเลยในประสาทสัมผัสทั้งสอง

แน่นอนมันเป็นไปได้และฉันคิดว่าค่อนข้างสมเหตุสมผลที่จะโต้เถียงตามบรรทัดเหล่านี้ที่จริงแล้วการใช้บ่อย ๆ ไม่ใช่กรอบการอนุมานเลย แต่เป็นการรวบรวมเกณฑ์การประเมินสำหรับกระบวนการอนุมานที่เป็นไปได้ทั้งหมดที่เน้นพฤติกรรมของพวกเขาในแอปพลิเคชันซ้ำ ๆ ตัวอย่างง่าย ๆ คือความมั่นคงไม่เอนเอียง ฯลฯ นี่ทำให้เห็นได้ชัดว่าไม่น่าสงสัยในความหมายที่ 2 อย่างไรก็ตามมันก็มีความเสี่ยงที่จะถูกมองว่าเป็นอัตนัยในความหมายที่ 1 เมื่อเราต้องตัดสินใจว่าจะต้องทำอย่างไร ตัวประมาณที่ไม่เอนเอียงที่จะมี) หรือเมื่อนำมาใช้ แต่ขัดแย้งกัน

ฟิชเชอร์เสนอความไม่ลงรอยกันบ่อย ๆ ที่น่าสนใจ สำหรับชาวประมงนั้นมีสิ่งที่อนุมานแบบอุปนัยในแง่ที่ว่านักวิทยาศาสตร์ได้ทำการอนุมานบนพื้นฐานของการวิเคราะห์ข้อมูลโดยนักสถิติ (ดังนั้นค่า p แต่ไม่ใช่อัลฟาและการวิเคราะห์พลังงาน) อย่างไรก็ตามการตัดสินใจเกี่ยวกับวิธีการปฏิบัติตนไม่ว่าจะดำเนินการกับการวิจัย ฯลฯ ทำโดยนักวิทยาศาสตร์บนพื้นฐานของความเข้าใจในทฤษฎีโดเมนของเธอไม่ใช่โดยนักสถิติที่ใช้กระบวนทัศน์การอนุมาน เนื่องจากการแบ่งงานของชาวประมงนี้ทั้งความรู้สึกส่วนตัว (ความรู้สึกที่ 2) และวิชาบุคคล (ความรู้สึกที่ 1) นั่งอยู่ทางด้านวิทยาศาสตร์ไม่ใช่ด้านสถิติ

Legalistically พูดบ่อย ๆ ของชาวประมงเป็นอัตนัย มันเป็นเพียงแค่เรื่องที่เป็นอัตนัยไม่ใช่นักสถิติ

มีการสังเคราะห์ที่หลากหลายของสิ่งเหล่านี้ทั้งการผสมผสานที่สอดคล้องกันแทบของทั้งสองนี้ที่คุณพบในตำราสถิติประยุกต์และรุ่นที่เหมาะสมยิ่งขึ้นเช่น 'สถิติข้อผิดพลาด' ที่ผลักดันโดย Deborah Mayo อันหลังนี้ค่อนข้างไม่น่าสงสัยในความรู้สึกที่ 2 แต่มีความรู้สึกส่วนตัวสูงในความรู้สึกที่ 1 เพราะนักวิจัยต้องใช้วิจารณญาณทางวิทยาศาสตร์ - สไตล์ฟิชเชอร์ - เพื่อที่จะทราบว่าข้อผิดพลาดที่น่าจะเป็น

บ่อยครั้งเป็นอัตนัย (ความรู้สึกแรก)

บ่อยครั้งที่ทัศนะในทัศนะของผู้ที่ถ่อมตัวลงบ่อยครั้งหรือไม่? มันขึ้นอยู่กับ. ขั้นตอนการอนุมานใด ๆ สามารถพรุนด้วย idiosyncracies ตามที่ใช้จริง ดังนั้นอาจมีประโยชน์มากกว่าที่จะถามว่าการใช้เป็นประจำจะกระตุ้นให้เกิดแนวทาง (ความรู้สึกแรก) น้อยลงหรือไม่? ฉันสงสัยว่า - ฉันคิดว่าการประยุกต์ใช้วิธีคิดแบบอัตนัย (ความรู้สึกที่สอง) นำไปสู่ผลลัพธ์ส่วนตัว (ความรู้สึกแรก) น้อยกว่า แต่มันสามารถโต้เถียงได้ทั้งสองวิธี

สมมติว่าช่วงเวลาที่ความรู้สึกส่วนตัว (สัมผัสแรก) แอบเข้าไปวิเคราะห์ผ่าน 'ตัวเลือก' Bayesianism ดูเหมือนจะเกี่ยวข้องกับ 'ตัวเลือก' มากขึ้น ในกรณีที่ง่ายที่สุดตัวเลือกนับรวมเป็น: หนึ่งชุดของสมมติฐานที่อาจเป็นไปได้สำหรับนิสัยบ่อย (ฟังก์ชั่นความน่าจะเป็นหรือเทียบเท่า) และสองชุดสำหรับ Bayesian (โอกาสและก่อนที่จะไม่ทราบ)

อย่างไรก็ตาม Bayesians รู้ว่าพวกเขาเป็นอัตนัย (ในความหมายที่สอง) เกี่ยวกับตัวเลือกเหล่านี้ทั้งหมดดังนั้นพวกเขาจึงมีแนวโน้มที่จะมีสติในตัวเองมากขึ้นเกี่ยวกับผลกระทบที่ควรนำไปสู่ความเป็นส่วนตัวน้อยลง (ในความหมายแรก)

ในทางตรงกันข้ามหากมีการทดสอบในหนังสือเล่มใหญ่การทดสอบหนึ่งจะได้รับความรู้สึกว่าผลที่ได้คือความรู้สึกส่วนตัวน้อยกว่า (ความรู้สึกแรก) แต่เนื้อหาที่เป็นผลมาจากการแทนการทำความเข้าใจปัญหาของคนอื่นด้วยตัวเอง . ไม่ชัดเจนว่าคนเรามีทัศนะแบบนี้น้อยลง แต่อาจรู้สึกเช่นนั้น ฉันคิดว่าส่วนใหญ่จะยอมรับว่าไม่ช่วยเหลือ


4
คำนิยามในพจนานุกรมของ 'อัตนัย' (ตรงจาก Google) กล่าวว่า: ขึ้นอยู่กับหรือได้รับอิทธิพลจากความรู้สึกรสนิยมหรือความคิดเห็นส่วนตัว เช่น "มุมมองของเขาเป็นส่วนตัวสูง" คำพ้อง: ส่วนบุคคลส่วนบุคคลของแต่ละบุคคลภายในอารมณ์สัญชาตญาณที่ใช้งานง่ายแบบอิมเพรส โปรดสังเกตว่าสิ่งนี้สะท้อนให้เห็นถึงทฤษฎีพื้นบ้านว่า 'มุมมอง' (เช่นความเชื่อ) เป็นอัตนัย (ความรู้สึกที่ 1: อิมเพรสชั่นนิส, หยั่งรู้แปลก ๆ ฯลฯ ) เพราะมันเกี่ยวข้องกับสถานะภายในของเรื่องใดเรื่องหนึ่ง (ความรู้สึก 2: ส่วนตัวบุคคล ฯลฯ ) .) แทนที่จะเป็นสาธารณะคือตัวตน
conjugateprior

2
มันอาจจะเป็นประโยชน์ในการคิดเกี่ยวกับจิตวิทยาความรู้ความเข้าใจเป็นตัวอย่าง ฟิลด์นี้จะสมบูรณ์อัตนัย (ในความหมายที่สองเพราะมันเป็นทั้งหมดเกี่ยวกับรัฐภายในของคนและผลกระทบที่มีต่อพฤติกรรมของผู้คนเหล่านั้น) แต่ก็ไม่ได้อัตนัยในความรู้สึกแรกเพราะนักจิตวิทยาไม่สามารถจริงเพียงแค่นั่งไปรอบ ๆ และทำให้สิ่งที่ขึ้นบน พื้นฐานของสถานะภายในของตนเอง
conjugateprior

2
ตรงกันข้ามกับสิ่งที่ตรงกันข้ามซึ่งมีบางสิ่งบางอย่างที่แปลกประหลาดและเป็นอัตนัย (ความรู้สึกที่ 1) แต่จริงๆแล้วสิ่งที่ไม่ได้เกี่ยวกับวิชานั้นเป็นเรื่องยากที่จะหา บางที Lucretius อธิบายอะตอมและโมฆะในde Rerum Naturaeเป็นตัวอย่าง
conjugateprior

1
เผง ภาษาอังกฤษค่อนข้างไม่ช่วยเหลือเกี่ยวกับเรื่องนี้ ...
conjugateprior

1
และฉันได้อนุมัติ (และปรับเปลี่ยนเล็กน้อย) การเปลี่ยนแปลงที่เสนอ
conjugateprior

6

ผู้กระทำในวิธีการที่ใช้บ่อยเป็นอาละวาดในการประยุกต์ใช้การอนุมาน เมื่อคุณทดสอบสมมติฐานที่คุณตั้งระดับความเชื่อมั่นพูด 95% หรือ 99% สิ่งนี้มาจากไหน มันไม่ได้มาจากทุกที่ยกเว้นความชอบของคุณเองหรือการฝึกฝนในสาขาของคุณ

เบย์ก่อนหน้านี้มีความสำคัญน้อยมากในชุดข้อมูลขนาดใหญ่เพราะเมื่อคุณอัปเดตด้วยข้อมูลการกระจายหลังจะลอยออกไปจากก่อนหน้าของคุณเมื่อประมวลผลข้อมูลมากขึ้น

ต้องบอกว่าเบย์เริ่มต้นจากคำจำกัดความที่เป็นอัตวิสัยของความน่าจะเป็นความเชื่อ ฯลฯ สิ่งนี้ทำให้พวกเขาแตกต่างจากผู้ใช้บ่อยซึ่งคิดในแง่ของความน่าจะเป็นวัตถุประสงค์ ในชุดข้อมูลขนาดเล็กสิ่งนี้สร้างความแตกต่าง

UPDATE: ฉันหวังว่าคุณเกลียดปรัชญาเท่าที่ฉันทำ แต่พวกเขามีความคิดบางอย่างที่น่าสนใจจากเวลาพิจารณาsubjectivism ฉันจะรู้ได้อย่างไรว่าฉันอยู่ใน SE จริง ๆ ? เกิดอะไรขึ้นถ้ามันเป็นความฝันของฉัน ฯลฯ :)


1
นอกเหนือจากการเลือกระดับความเชื่อมั่นในการทดสอบสมมติฐาน (ตั้งแต่เดียวกันอาจเป็นที่ถกเถียงกันในสถิติแบบเบย์เช่นเมื่อเลือกเกณฑ์สำหรับการเปรียบเทียบ HDP / HDI กับ ROPE สำหรับการปฏิเสธหรือยอมรับสมมติฐาน ) ผู้กระทำมีบทบาทใน ได้รับการประเมินจุดหรือได้รับช่วงความเชื่อมั่นอาจเป็นทางเลือกของการประมาณหรือไม่?
Amelio Vazquez-Reina

1
นอกจากนี้ความเข้าใจของฉันก็คือระดับความสำคัญตั้งอยู่ในสถิติของผู้ใช้บ่อยในบริบทของการตัดสินใจ (เช่นเราควรปฏิเสธสมมติฐานว่างหรือไม่) ไม่ใช่ในการคำนวณความน่าจะเป็น ในทฤษฎีการตัดสินใจแบบเบย์เดียวกันก็อาจจะเป็นที่ถกเถียงกันเกี่ยวกับการเลือกฟังก์ชั่นการสูญเสียซึ่งอาจส่งผลต่อการตัดสินใจ (เลือก) ที่เหมาะสมที่สุด ยิ่งไปกว่านั้นค่าระดับความเชื่อมั่นมักจะถูกเลือกจากอัตราความผิดพลาดประเภทที่ยอมรับได้ (เช่น 95% ใน NHST ถูกกำหนดโดยตรงจาก "อัตราบวกเป็นเท็จไม่เกิน 5%")
Amelio Vazquez-Reina

4
แน่นอนว่าเรื่องก่อน ๆ นั้นค่อนข้างน้อยเมื่อวิเคราะห์ชุดข้อมูลขนาดใหญ่สำหรับปัญหาสมัยใหม่ที่น่าสนใจที่สุด จริงเรามีผลเป็นซีมโทติคเมื่อn และ พี«nแต่โดยทั่วไปแล้วคนที่มีชุดข้อมูลขนาดใหญ่จะถามคำถามใหญ่ ๆ พี ในอัตราที่เทียบได้กับ nและที่นี่ก่อนที่เหมาะสมจะไปทำหน้าที่เหมือน regularizer และจะมีความสำคัญอย่างมาก
คนที่แต่งตัวประหลาด

5
มันอาจจะคุ้มค่าที่สังเกตได้ว่าฟังก์ชั่นการสูญเสียอาจไม่เป็นอัตนัย (กล่าวคือถูกกำหนดโดยบริบทอย่างสมบูรณ์) ซึ่งในกรณีนี้การตัดสินใจที่ดีที่สุดของเบย์มีศักยภาพที่จะเป็นวัตถุประสงค์ที่สมบูรณ์นอกเหนือจากก่อนหน้านี้

1
@ Matthew ใช่แม้ว่ามันจะเป็นจริงสำหรับการเลือก αใน NHST จากอัตราการบวกเท็จที่ยอมรับได้สูงสุดอย่างที่ฉันได้กล่าวไว้ข้างต้น
Amelio Vazquez-Reina
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.