ความสับสนเกี่ยวกับ kriging


9

ฉันอ่านบทความวิกิพีเดียที่เกี่ยวข้องกับการดึงดูด ฉันไม่เข้าใจตอนที่มันบอกว่า

Kriging คำนวณตัวประมาณค่าแบบเส้นตรง Z^(x0)ของ Z(x0)เช่นนั้นความแปรปรวน kriging ของจะลดลงด้วยสภาพที่เป็นกลาง ฉันไม่ได้รับมาและวิธีลดความแปรปรวน ข้อเสนอแนะใด ๆ

พิเศษฉันไม่ได้รับส่วนที่ใช้ลดลงภายใต้เงื่อนไขที่เป็นกลาง

ฉันคิดว่ามันควรจะเป็น

E [Z '(x0) -Z (x0)] แทน E [Z' (x) -Z (x)] ใช่ไหม 'เทียบเท่ากับหมวกในบทความ wiki นอกจากนี้ฉันไม่เข้าใจว่าข้อผิดพลาดเกิดขึ้นได้อย่างไร


คุณจะได้รับการแขวนอยู่ที่ไหนในที่มา?
whuber

ส่วนที่คำนวณความผิดพลาดของการส่งสัญญาณและกำหนดเงื่อนไขที่ไม่เอนเอียง มันเป็นการดีที่จะบอกว่าเงื่อนไขที่เป็นกลางหมายถึงความคาดหวังของตัวประมาณและตัวจริงจะเท่ากัน ฉันได้แก้ไขโพสต์เพื่อรวมรายละเอียด
user31820

ฉันคิดว่าคุณถูกต้องที่การแสดงออกของวิกิพีเดียควรอ่าน E[Z(x0)Z(x0)].
whuber

คำตอบ:


13

สมมติ (Z0,Z1,,Zn) เป็นเวกเตอร์ที่สันนิษฐานว่ามีการแจกแจงหลายตัวแปรของค่าเฉลี่ยที่ไม่รู้จัก (μ,μ,,μ)และเมทริกซ์ความแปรปรวนร่วม - ความแปรปรวนร่วมที่เป็นที่รู้จักΣ. เราสังเกต(z1,z2,,zn)จากการกระจายนี้และต้องการที่จะทำนาย z0 จากข้อมูลนี้โดยใช้การทำนายเชิงเส้นตรง:

  • เส้นตรงหมายถึงการคาดการณ์จะต้องอยู่ในรูปแบบz0^=λ1z1+λ2z2++λnzn สำหรับค่าสัมประสิทธิ์ λiที่จะได้รับการพิจารณา ค่าสัมประสิทธิ์เหล่านี้สามารถขึ้นอยู่กับสิ่งที่เป็นที่รู้จักกันล่วงหน้ามากที่สุด: คือรายการของΣ.

ตัวทำนายนี้สามารถพิจารณาได้ว่าเป็นตัวแปรสุ่ม Z0^=λ1Z1+λ2Z2++λnZn.

  • เป็นกลางหมายถึงความคาดหวังของZ0^ เท่ากับค่าเฉลี่ย (ไม่ทราบ) μ.

การเขียนออกมาให้ข้อมูลเกี่ยวกับค่าสัมประสิทธิ์:

μ=E[Z0^]=E[λ1Z1+λ2Z2++λnZn]=λ1E[Z1]+λ2E[Z2]++λnE[Zn]=λ1μ++λnμ=(λ1++λn)μ.

บรรทัดที่สองเกิดจากความเป็นเส้นตรงของความคาดหวังส่วนที่เหลือเป็นพีชคณิตแบบง่าย เพราะขั้นตอนนี้จะทำงานโดยไม่คำนึงถึงคุณค่าของμเห็นได้ชัดว่าสัมประสิทธิ์ต้องรวมกับความสามัคคี การเขียนสัมประสิทธิ์ในสัญกรณ์เวกเตอร์λ=(λi)นี้สามารถเขียนได้อย่างเรียบร้อย 1λ=1.

ในบรรดาชุดของตัวทำนายเชิงเส้นที่ไม่เอนเอียงดังกล่าวทั้งหมดเราแสวงหาสิ่งหนึ่งที่เบี่ยงเบนจากมูลค่าที่แท้จริงเท่าที่จะเป็นไปได้เล็กน้อยซึ่งวัดในห้องหมายถึงกำลังสอง นี่คือการคำนวณอีกครั้ง มันขึ้นอยู่กับความหลากหลายทางชีวภาพและความสมมาตรของความแปรปรวนร่วมซึ่งการประยุกต์ใช้เป็นผู้รับผิดชอบสำหรับการรวมในบรรทัดที่สอง:

E[(Z0^Z0)2]=E[(λ1Z1+λ2Z2++λnZnZ0)2]=i=1nj=1nλiλjvar[Zi,Zj]2i=1nλivar[Zi,Z0]+var[Z0,Z0]=i=1nj=1nλiλjΣi,j2i=1nλiΣ0,i+Σ0,0.

ดังนั้นสัมประสิทธิ์สามารถลดลงได้จากการลดรูปกำลังสองนี้ให้อยู่ภายใต้ข้อ จำกัด (เชิงเส้น) 1λ=1. นี่คือการแก้ไขโดยใช้วิธีการคูณลากรองจ์ยอมเป็นเส้นตรงระบบของสมการที่ "สมการ Kriging"

ในแอปพลิเคชั่น Zเป็นกระบวนการสุ่มเชิงพื้นที่ ("สนามสุ่ม") ซึ่งหมายความว่าสำหรับชุดที่กำหนดคงที่ (ไม่ใช่แบบสุ่ม)x0,,xn, เวกเตอร์ของค่าของ Z ที่สถานที่เหล่านั้น (Z(x0),,Z(xn))มีการสุ่มด้วยการแจกแจงหลายตัวแปรบางชนิด เขียนZi=Z(xi)และใช้การวิเคราะห์ที่กล่าวมาข้างต้นโดยถือว่าวิธีการของกระบวนการทั้งหมดn+1 สถานที่ xiเหมือนกันและสมมติว่าเมทริกซ์ความแปรปรวนร่วมของค่ากระบวนการที่สิ่งเหล่านี้n+1 สถานที่เป็นที่รู้จักด้วยความมั่นใจ

ลองตีความสิ่งนี้ ภายใต้สมมติฐาน (รวมถึงค่าเฉลี่ยคงที่และความแปรปรวนร่วมที่รู้จัก) ค่าสัมประสิทธิ์จะกำหนดความแปรปรวนขั้นต่ำที่สามารถทำได้โดยตัวประมาณเชิงเส้นใด ๆ ลองเรียกความแปรปรวนนี้σOK2("OK" สำหรับ "kriging ธรรมดา") มันขึ้นอยู่กับเมทริกซ์เท่านั้นΣ. มันบอกเราว่าถ้าเราต้องสุ่มตัวอย่างจาก(Z0,,Zn) และใช้สัมประสิทธิ์เหล่านี้เพื่อทำนาย z0 ค่าจากค่าที่เหลืออยู่ในแต่ละครั้งแล้ว

  1. โดยเฉลี่ยการคาดการณ์ของเราจะถูกต้อง

  2. โดยปกติแล้วการคาดการณ์ของเราจาก z0 จะเบี่ยงเบนเกี่ยวกับ σOK จากค่าจริงของ z0.

จำเป็นต้องกล่าวเพิ่มเติมอีกก่อนหน้านี้ว่าจะสามารถนำไปใช้กับสถานการณ์จริงเช่นการประเมินพื้นผิวจากข้อมูลที่ตรงเวลา: เราต้องการสมมติฐานเพิ่มเติมเกี่ยวกับลักษณะทางสถิติของกระบวนการเชิงพื้นที่ที่แตกต่างกันไปจากที่หนึ่งไปอีกที่หนึ่ง ในทางปฏิบัติมักจะมีการรับรู้เพียงครั้งเดียวเท่านั้น) แต่การแสดงออกนี้ควรจะเพียงพอที่จะทำตามวิธีการค้นหา "ที่ดีที่สุด" เชิงเส้นตรงทำนาย ("BLUP") นำไปสู่ระบบสมการเชิงเส้นตรงไปตรงมา


โดยวิธีการที่ kriging ตามปกติจะไม่เหมือนกับการประมาณกำลังสองน้อยที่สุดเพราะ Σถูกประเมินในขั้นตอนเบื้องต้น (หรือที่เรียกว่า "Variography") โดยใช้ข้อมูลเดียวกัน นั่นคือสิ่งที่ตรงกันข้ามกับข้อสันนิษฐานของแหล่งที่มานี้ซึ่งสันนิษฐานว่าΣเป็นที่รู้จัก (และFortioriเป็นอิสระจากข้อมูล) ดังนั้นเมื่อเริ่มแรกคูริงมีข้อบกพร่องทางความคิดและสถิติบางประการที่มีอยู่ในตัว ผู้ปฏิบัติที่ไตร่ตรองได้รับการตระหนักถึงสิ่งนี้มาโดยตลอดและพบวิธีการสร้างสรรค์ที่หลากหลายเพื่อพิสูจน์ความไม่สอดคล้องกัน (การมีข้อมูลจำนวนมากสามารถช่วยได้จริง ๆ ) ปัจจุบันมีกระบวนการสำหรับการประเมินพร้อมกันΣและทำนายการรวบรวมค่าในสถานที่ที่ไม่รู้จัก พวกเขาต้องการสมมติฐานที่แข็งแกร่งขึ้นเล็กน้อย (กฎเกณฑ์หลายตัวแปร) เพื่อบรรลุความสำเร็จนี้


มีเว็บไซต์ที่พวกเขาพูดจาโผงผางกับการหัวเราะเยาะและดูเหมือนว่าเขามีคะแนนที่ถูกต้อง ฉันคิดว่าย่อหน้าสุดท้ายของคุณที่นี่ส่องสว่างมาก
Wayne

@ เวย์นใช่คุณสามารถบอกได้ว่าฉันกำลังทำอะไรอยู่ แต่ถึงแม้ว่าจะมีการใช้ kriging เป็น "น้ำมันงู" โดยที่ปรึกษา แต่ก็มีหลายสิ่งที่เกิดขึ้นรวมถึงทฤษฎี "การเปลี่ยนแปลงการสนับสนุน" เพื่อเปรียบเทียบข้อมูลที่ได้จากตัวอย่างขนาดเล็กไปจนถึงข้อมูลที่ได้จากขนาดที่ใหญ่กว่ามาก ส่วนของสื่อนั้น ในที่สุด Kriging อยู่ที่จุดสูงสุดของการสร้างแบบจำลองเชิงพื้นที่และเวลาที่ทันสมัยที่สุดในปัจจุบัน นอกจากนี้ยังเป็นวิธีที่มีประโยชน์ในการประเมินข้อเสนอทางเลือก: เช่น interpolators เชิงพื้นที่จำนวนมากเป็นแบบเชิงเส้น (หรือสามารถเป็นแบบเชิงเส้น) ดังนั้นจึงเป็นเรื่องที่ยุติธรรมที่จะเปรียบเทียบความแปรปรวนการประมาณของพวกเขากับของแบบจำลอง
whuber

1

Kriging เป็นเพียงการประมาณกำลังสองน้อยที่สุดสำหรับข้อมูลเชิงพื้นที่ เช่นนี้ให้ตัวประมาณเชิงเส้นตรงที่ลดผลรวมของข้อผิดพลาดกำลังสองน้อยที่สุด เนื่องจากไม่มีความเป็นกลาง MSE = ความแปรปรวนของตัวประมาณและเป็นค่าต่ำสุด


ฉันไม่ได้รับส่วนในการคำนวณข้อผิดพลาดที่น่าสนใจนอกจากนี้ฉันยังสับสนกับความแปรปรวนและความแปรปรวนที่เกิดขึ้น อะไรคือความแตกต่างและความสำคัญของพวกเขาคืออะไร
user31820

@whuber ขอบคุณสำหรับคำอธิบาย แต่ฉันไม่ได้รับสมการเมื่อคุณคำนวณ MSE ของค่าที่ทำนายโดยการประมาณที่ไม่เอนเอียงและตัวประมาณที่แท้จริง บรรทัดที่สองที่เฉพาะเจาะจงในสมการนั้น
user31820

@whuber และฉันไม่ได้รับส่วน wiki เมื่อคำนวณความแปรปรวน kriging ซึ่งคล้ายกับคำตอบของคุณ พวกเขามีผลลัพธ์เดียวกัน แต่เงื่อนไขเริ่มต้นแตกต่างกัน มาทำไม
user31820
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.