มีความแตกต่างในวิธีการแบบเบย์และวิธี EDA เป็นประจำหรือไม่?


14

กล่าวอย่างง่ายมาก: มีความแตกต่างในวิธีการแบบเบย์และความถี่ในการวิเคราะห์ข้อมูลเชิงสำรวจหรือไม่?

ฉันรู้ว่าไม่มีอคติโดยธรรมชาติในวิธีการ EDA เช่นเดียวกับฮิสโตแกรมคือฮิสโตแกรม, Scatterplot เป็น scatterplot, ฯลฯ และฉันไม่พบตัวอย่างของความแตกต่างในวิธีการสอนหรือนำเสนอ EDA (โดยไม่สนใจบทความเชิงทฤษฎีโดย A. Gelman) . ในที่สุดฉันดู CRAN ผู้ตัดสินทุกสิ่งที่นำไปใช้: ฉันไม่พบแพ็คเกจที่ปรับให้เข้ากับวิธีการแบบเบย์ อย่างไรก็ตามฉันคิดว่าประวัติย่ออาจมีบางคนที่สามารถแสดงความเห็นเกี่ยวกับเรื่องนี้

ทำไมต้องมีความแตกต่าง

สำหรับผู้เริ่ม:

  1. เมื่อระบุการแจกแจงที่เหมาะสมก่อนใครควรตรวจสอบสิ่งนี้ด้วยตาเปล่าหรือไม่?
  2. เมื่อสรุปข้อมูลและแนะนำว่าควรใช้โมเดลประจำหรือ Bayesian EDA ไม่ควรแนะนำทิศทางใดให้ไป
  3. ทั้งสองวิธีมีความแตกต่างอย่างชัดเจนในวิธีการจัดการกับแบบจำลองการผสม การระบุว่าตัวอย่างที่น่าจะมาจากการผสมของประชากรนั้นมีความท้าทายและเกี่ยวข้องโดยตรงกับวิธีการที่ใช้ในการประมาณค่าพารามิเตอร์การผสม
  4. ทั้งสองวิธีรวมโมเดล Stochastic และการเลือกแบบจำลองนั้นมาจากการทำความเข้าใจข้อมูล ข้อมูลที่ซับซ้อนมากขึ้นหรือตัวแบบที่ซับซ้อนมากขึ้นทำให้ EDA มีเวลามากขึ้น ด้วยความแตกต่างดังกล่าวระหว่างโมเดล Stochastic หรือกระบวนการสร้างจึงมีความแตกต่างในกิจกรรม EDA ดังนั้นจึงไม่ควรมีความแตกต่างที่เกิดขึ้นจากวิธี Stochastic ที่แตกต่างกันใช่หรือไม่

หมายเหตุ 1: ฉันไม่ได้กังวลเกี่ยวกับปรัชญาของ "ค่าย" - ฉันต้องการพูดถึงช่องว่างใด ๆ ในชุดเครื่องมือและวิธีการ EDA ของฉัน

คำตอบ:


17

ในใจของฉัน Bayes vs บ่อยครั้งเป็นเรื่องเกี่ยวกับการอนุมานอย่างเป็นทางการและการวิเคราะห์ข้อมูลเชิงสำรวจไม่ใช่

แน่นอนเมื่อพูดถึงการประเมินแบบจำลอง / การวิเคราะห์ความเหมาะสมและความอ่อนไหวซึ่งฉันได้จำแนกคะแนนของคุณ (1) (3) และ (4) จะมีความแตกต่างในวิธีดำเนินการ แต่ นั่นเป็นเพราะธรรมชาติของความแตกต่างระหว่างการวิเคราะห์และวิธีการคำนวณมากกว่าเกี่ยวกับปรัชญา

เกี่ยวกับ (2) ของคุณโดยทั่วไปฉันไม่เห็นผลลัพธ์ของ EDA ที่ชี้ให้คุณเห็นแนวทางแบบเบย์หรือผู้มีความรู้รอบรู้ แต่ฉันคิดว่ามันเป็นเป้าหมายของการศึกษาที่สำคัญที่สุด

สำหรับฉันเป็นการส่วนตัว EDA (รวมถึงวิปัสสนาลึก) จะชี้ให้ฉันไปที่แบบจำลองและถ้าฉันสามารถหาวิธีการบ่อยนักธรรมชาติที่ตอบคำถามทางวิทยาศาสตร์ที่ดีพอฉันจะไปด้วย แต่ถ้าโดยธรรมชาติของสถานการณ์ ไม่มีวิธีการที่ใช้บ่อยจะทำงานได้ดีและถ้ามีเหตุผลมาก่อนฉันจะใช้ Bayes


(+1) พูดได้ดีมาก - โดยเฉพาะ "EDA (บวกกับการวิปัสสนาอย่างลึกซึ้ง) จะชี้ให้ฉันเห็นนางแบบ"
suncoolsu

+1 เช่นกัน EDA ไม่ได้เกี่ยวกับการเลือกมุมมอง แต่เป็นเรื่องเกี่ยวกับการทำความเข้าใจข้อมูลของคุณเพื่อการตัดสินใจอย่างชาญฉลาด
Fomite

+1 สำหรับคำตอบที่ดี น่าเสียดายที่ฉันคิดว่าคำถามเดิมเข้าใจผิด ฉันไม่ได้ถามเกี่ยวกับการใช้ EDA เพื่อตัดสินใจระหว่างแบบจำลอง Bayesian หรือแบบผู้ใช้บ่อย ฉันจะต้องตรวจสอบว่าฉันพูดอย่างไรถ้าดูเหมือนว่าหลายคนมีความเข้าใจผิดเหมือนกัน
Iterator

@Iterator ฉันเข้าใจว่าคำถามหลักของคุณคือ: มีความแตกต่างระหว่างแนวทางของ Bayesians และความถี่ของ EDA หรือไม่? คำตอบของฉันคือ: ไม่; EDA นั้นไม่ใช่ประจำหรือ Bayesian
คาร์ล

3
ฉันคิดว่าคำจำกัดความของ "การวิเคราะห์ข้อมูลเชิงสำรวจ" นั้นแคบกว่าของคุณมาก ในมุมมองของฉันการวิเคราะห์ข้อมูลที่ดีทั้งหมดเกี่ยวข้องกับการสำรวจ สิ่งที่แตกต่าง "การวิเคราะห์ข้อมูลเชิงสำรวจ" คือการขาดโมเดลหรือความพยายามใด ๆ ที่มีต่อการอนุมานอย่างเป็นทางการ
Karl

0

ฉันคิดว่า EDA ช่วยให้คุณสร้างแบบจำลองสร้างสมมติฐานบางอย่างและ (ถ้าจำเป็น) ให้อัปเดตโมเดลและสมมติฐานของมัน ฉันเลือกวิธีปฏิบัติเพื่อใช้สำหรับการปรับแบบจำลองและการประเมินผล

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.