ข้อได้เปรียบหลักของแบบจำลองกระบวนการเกาส์เซียน


11

กระบวนการแบบเกาส์ใช้กันอย่างแพร่หลายโดยเฉพาะอย่างยิ่งในการแข่งขัน เป็นที่ทราบกันดีว่าความต้องการการคำนวณสูง ( )0(n3)

  1. อะไรทำให้พวกเขาโด่งดัง
  2. อะไรคือข้อได้เปรียบหลักและซ่อนเร้นของพวกเขา?
  3. เหตุใดพวกเขาจึงใช้โมเดลพาราเมตริก (โดยโมเดลพาราเมทริกฉันหมายถึงการถดถอยเชิงเส้นแบบทั่วไปซึ่งรูปแบบพาราเมทริกที่แตกต่างกันสามารถใช้อธิบายแนวโน้มอินพุทและเอาท์พุท; เช่น qaudratic)

ฉันขอขอบคุณคำตอบทางเทคนิคที่อธิบายคุณสมบัติโดยธรรมชาติที่ทำให้กระบวนการแบบเกาส์แตกต่างและมีประโยชน์


คุณสามารถอธิบายสิ่งที่คุณหมายถึงโดยโมเดลพาราเมตริกหรือไม่?
Alexey Zaytsev

@ Alexey ฉันได้ชี้แจงสิ่งที่ฉันหมายถึงโดย paramtric model ด้านบน ขอบคุณ
Wis

จากสิ่งที่ฉันคิดเกี่ยวกับโมเดลพาราเมตริกคุณต้องระบุรุ่นด้วยมือสำหรับแต่ละปัญหา สิ่งนี้เป็นไปไม่ได้เสมอไปเนื่องจากธรรมชาติที่แท้จริงไม่เป็นที่รู้จักเสมอไป ยิ่งไปกว่านั้นอาจมีปัญหากับการปรับแบบจำลองเหล่านี้ในขณะที่การประเมินพารามิเตอร์กระบวนการแบบเกาส์นั้นใช้งานได้ดีเกือบทุกครั้ง
Alexey Zaytsev

4
เส้นโค้งและการถดถอยเชิงเส้นเทียบเท่ากับการถดถอยแบบเกาส์กระบวนการโดยเลือกฟังก์ชันความแปรปรวนร่วมที่เหมาะสม แต่กระบวนการแบบเกาส์ให้กรอบความน่าจะเป็นที่สะดวกเหมาะสำหรับงานหลายอย่าง
Alexey Zaytsev

1
เมื่อใดที่คุณจะไม่ใช้กระบวนการ Gaussian
Alby

คำตอบ:


6

ข้อดีหลักมาจากมุมมองทางวิศวกรรม (ตามที่ @Alexey ระบุไว้) ในขั้นตอนการKriging ที่ใช้กันอย่างแพร่หลายคุณสามารถตีความ "ช่องว่าง" ของคุณเองโดยจัดทำแบบจำลอง "สหสัมพันธ์" (หรือความแปรปรวนร่วม) (โดยทั่วไปเรียกว่ารูปวงรีรูปไข่ ) สำหรับความสัมพันธ์ขึ้นอยู่กับระยะทางและทิศทาง

ไม่มีอะไรที่ป้องกันวิธีการอื่นที่จะมีคุณสมบัติแบบเดียวกันมันเพิ่งเกิดขึ้นที่วิธีการทำให้เป็นแนวคิดแรกที่มีแนวคิดเป็นมิตรกับคนที่ไม่ใช่นักสถิติ

ทุกวันนี้ด้วยวิธีการสุ่มตัวอย่างทางธรณีวิทยาที่เพิ่มขึ้นเช่นSequential Gaussian Simulation ในหมู่คนอื่น ๆขั้นตอนเหล่านี้กำลังถูกนำมาใช้ในภาคส่วนที่จำเป็นต้องกำหนดพื้นที่ที่ไม่แน่นอน (ซึ่งอาจใช้เวลาหลายพันล้านมิติ) อีกครั้งจากจุดวิศวกรรมในมุมมองของอัลกอริทึม Geostatistics ตามได้ง่ายมากที่จะรวมอยู่ในโปรแกรมทางพันธุกรรม ดังนั้นเมื่อคุณมีปัญหาผกผันคุณจำเป็นต้องทดสอบหลายสถานการณ์และทดสอบการปรับตัวให้เข้ากับฟังก์ชั่นการเพิ่มประสิทธิภาพของคุณ

เราจะทิ้งการโต้แย้งอันบริสุทธิ์ไว้สักครู่เพื่อให้สถานะเป็นข้อเท็จจริงสำหรับตัวอย่างจริงที่ทันสมัยของการใช้งานนี้ คุณสามารถสุ่มตัวอย่างตัวอย่างใต้ดินโดยตรง (ข้อมูลยาก) หรือสร้างแผนที่คลื่นไหวสะเทือนของดินใต้ผิวดิน (soft-data)

ในข้อมูลที่ยากคุณสามารถวัดคุณสมบัติ (สมมติว่าอิมพิแดนซ์อะคูสติก) โดยตรงโดยไม่มีข้อผิดพลาด (ish) ปัญหาคือว่ามันหายาก (และแพง) ในอีกทางหนึ่งคุณมีการทำแผนที่คลื่นไหวสะเทือนซึ่งเป็นปริมาตรพิกเซลที่ชาญฉลาดแผนที่ของพื้นผิวดิน แต่ไม่ได้ให้ความต้านทานทางเสียง เพื่อความง่ายสมมติว่ามันให้อัตราส่วนระหว่างสองค่าของอิมพีแดนซ์อะคูสติก (บนและล่าง) อัตราส่วน 0.5 อาจเป็นส่วนหนึ่งของ 1,000/2000 หรือ 10 000/20 000 มันเป็นพื้นที่การแก้ปัญหาที่หลากหลายและการรวมกันหลายอย่างจะทำ แต่เพียงหนึ่งเดียวที่ถูกต้องแสดงถึงความเป็นจริง คุณจะแก้ปัญหานี้อย่างไร

วิธีการทำงานของการเกิดแผ่นดินไหวผกผัน (กระบวนการสุ่ม) คือการสร้างความน่าเชื่อถือ (และนี่เป็นอีกเรื่องที่รวมเข้าด้วยกัน) สถานการณ์ของความต้านทานทางเสียง (หรือคุณสมบัติอื่น ๆ ) เปลี่ยนสถานการณ์เหล่านั้นให้เป็นแผ่นดินไหวแบบสังเคราะห์ (เช่นอัตราส่วนในตัวอย่างก่อนหน้า) และ เปรียบเทียบคลื่นไหวสะเทือนสังเคราะห์กับของจริง (สหสัมพันธ์) สถานการณ์ที่ดีที่สุดจะถูกนำมาใช้เพื่อสร้างสถานการณ์ให้มากขึ้นโดยรวมเป็นโซลูชัน (นี่ไม่ใช่เรื่องง่ายอย่างที่คิด)

การคำนึงถึงสิ่งนี้และการพูดจากมุมมองของการใช้งานฉันจะตอบคำถามของคุณด้วยวิธีต่อไปนี้:

1) สิ่งที่ทำให้พวกเขาได้รับความนิยมคือการใช้งานความยืดหยุ่นในการนำไปใช้งานศูนย์การวิจัยและสถาบันการศึกษาจำนวนมากที่ให้การปรับปรุงกระบวนการแบบเกาส์แบบใหม่และปรับตัวได้ดีขึ้นสำหรับสาขาวิชาต่าง ๆ

2) ข้อดีหลักๆ ดังกล่าวก่อนหน้านี้คือการใช้งานและความยืดหยุ่นจากมุมมองของฉัน ถ้ามันใช้งานง่ายและใช้งานง่ายคุณก็ทำได้ ไม่มีคุณสมบัติพิเศษในกระบวนการ Gaussian ที่ไม่สามารถทำซ้ำได้ในวิธีการอื่น (สถิติหรืออย่างอื่น)

3) พวกเขาจะใช้เมื่อคุณต้องการรวมข้อมูลเพิ่มเติมลงในแบบจำลองของคุณไม่ใช่แค่ข้อมูล (ข้อมูลดังกล่าวมีความสัมพันธ์ที่ชาญฉลาดในพื้นที่การกระจายทางสถิติและอื่น ๆ ... ) ฉันสามารถมั่นใจได้ว่าถ้าคุณมีข้อมูลจำนวนมากที่มีพฤติกรรมแบบ isotropic โดยใช้ kriging จะเป็นการเสียเวลา คุณสามารถได้ผลลัพธ์เดียวกันโดยใช้วิธีอื่นใดที่ต้องการข้อมูลน้อยลงก็จะทำงานได้เร็วขึ้น


และรุ่นอื่นเป็นทางเลือกที่ดีกว่าเมื่อใด
Ben

1
@Ben มันจะขึ้นอยู่กับกรณีศึกษา Kriging หรือวิธีการอิง Kriging มีค่าใช้จ่ายในการคำนวณสูง (ดังนั้นไม่เร็ว) ตัวอย่างเช่นทีวี 4k ที่ทันสมัย ​​(หรือมากกว่า) ใช้วิธีการแก้ไขเพื่อลองและปรับปรุงเนื้อหาที่ทำขึ้นเพื่อความละเอียดที่น้อยลง นี่หมายความว่าจำเป็นต้องดำเนินการนี้อย่างรวดเร็วและไม่ต้องมีการแทรกแซงจากผู้ใช้ (ซึ่งจำเป็นต้องมีโมเดลความแปรปรวนร่วม) ถ้าฉันจะแก้ปัญหานี้โดยเฉพาะฉันก็จะหลีกเลี่ยงการ Kriging โดยสิ้นเชิง ยิ่งไปกว่านั้นปรากฏการณ์บางอย่างเป็นไปตามรูปแบบหรือมีตัวแปรไม่ต่อเนื่องหรือสามารถลดลงเป็นสูตร (ตัวอย่างเช่น FEM) ฯลฯ ...
armatita

และเมื่อความเร็วไม่สำคัญ?
Ben

@Ben Speed ​​มีความสำคัญน้อยกว่าหากผลลัพธ์ของคุณไม่จำเป็นต้องเป็นแบบทันที การสร้างแบบจำลองใต้ผิวดินการพยากรณ์อากาศและการปฏิบัติการหลายอย่างภายในวิทยาศาสตร์ GIS เป็นเพียงตัวอย่างเล็ก ๆ น้อย ๆ อีกอย่างหนึ่งคือคำตอบที่แสดง (การผกผันของแผ่นดินไหว)
armatita

ขออภัยไม่เข้าใจ ทั้งความเร็วในการคำนวณและผลลัพธ์นั้นมีความสำคัญอะไรข้อเสียของ GP คืออะไร หรือพูดอีกอย่าง: มันไม่ควรใช้บ่อยกว่านี้เหรอ?
Ben

7

สำหรับวิศวกรเป็นสิ่งสำคัญ:

  • มีช่วงความมั่นใจสำหรับการคาดการณ์
  • เพื่อสอดแทรกข้อมูลการฝึกอบรม
  • ที่จะมีรูปแบบที่ราบรื่นและไม่เชิงเส้น
  • ใช้แบบจำลองการถดถอยที่ได้รับสำหรับการออกแบบการทดลองและการปรับให้เหมาะสม

กระบวนการแบบเกาส์ตรงตามข้อกำหนดเหล่านี้ทั้งหมด

ยิ่งไปกว่านั้นชุดข้อมูลวิศวกรรมและภูมิศาสตร์มักจะไม่ใหญ่หรือมีโครงสร้างกริดที่เฉพาะเจาะจงซึ่งทำให้สามารถอนุมานได้อย่างรวดเร็ว


1
ขอบคุณสำหรับความคิดเห็นของคุณ . ดูเหมือนว่าเนื่องจากกระบวนการแบบเกาส์การตีความแบบเบส์ของพวกเขาสามารถมีปริมาณความไม่แน่นอนที่ดีอย่างไรก็ตามสิ่งนี้ยังเป็นไปได้ในการถดถอยแบบพารามิเตอร์ ฉันกำลังมองหาวิธีการทางเทคนิคที่สามารถอธิบายชุดของข้อได้เปรียบทางสถิติ
Wis

3

ข้อดีของแบบเกาส์เซียน

Gaussian PDF ขึ้นอยู่กับช่วงเวลาการสั่งซื้อลำดับที่ 1 และช่วงเวลาที่ 2 กระบวนการแบบเกาส์ที่อยู่กับที่ในวงกว้างยังเป็นกระบวนการที่อยู่กับที่อย่างเข้มงวดและในทางกลับกัน

Gaussian PDF สามารถจำลองแบบการกระจายของกระบวนการต่าง ๆ รวมถึงสัญญาณและสัญญาณรบกวนที่สำคัญบางประเภท ผลรวมของกระบวนการสุ่มอิสระจำนวนมากมีการแจกแจงแบบเกาส์ (ทฤษฎีบทขีด จำกัด กลาง)

กระบวนการที่ไม่ใช่แบบเกาส์เซียนสามารถประมาณได้ด้วยการรวมกันแบบถ่วงน้ำหนัก (เช่นส่วนผสม) ของไฟล์ PDF แบบเกาส์จำนวนหลายวิธีที่เหมาะสมและมีความแปรปรวน

วิธีการประมาณค่าที่เหมาะสมที่สุดโดยใช้แบบจำลองเกาส์เซียนมักจะส่งผลให้เกิดการแก้ปัญหาเชิงเส้นตรงและทางคณิตศาสตร์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.