ทำไมคุณต้องจัดทำรูปแบบตัวอักษรย่อตัวเมื่อคุณได้รับความสนใจ


9

ฉันยังใหม่กับสถิติเชิงพื้นที่และดูแบบฝึกหัดมากมาย

แต่ฉันไม่เข้าใจว่าทำไมคุณต้องจัดทำรูปแบบ Variogram เมื่อคุณ krige

ฉันใช้แพ็คเกจ gstat ใน R และนี่คือตัวอย่างที่พวกเขาให้:

library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)

มีใครสามารถอธิบายในสองบรรทัดทำไมคุณต้องจัดหา vgm ก่อน? และคุณจะตั้งค่าพารามิเตอร์ได้อย่างไร

ขอบคุณล่วงหน้า! แคสเปอร์


สำหรับkriging แบบง่ายตัวประมาณค่าเป็นสีน้ำเงินก็ต่อเมื่อค่าเฉลี่ยและความแปรปรวนเชิงพื้นที่เป็นที่รู้จักล่วงหน้า ในkriging สามัญหนึ่งประมาณความแปรปรวนจากข้อมูลแล้วทำการแก้ไข ดูบทความสั้นจากgstatแพ็คเกจ Rของข้อมูล meuse เดียวกัน
Andy W

เฮ้แอนดี้ขอบคุณสำหรับความคิดเห็นของคุณ ฉันค้นพบในบทความสั้น ๆ ที่คุณยังสามารถใช้ krige ได้โดยไม่ต้องมีรูปแบบ Variogram ฉันทำสิ่งต่อไปนี้: krige (ส่วนที่เหลือ ~ 1, temp_plot_spatial, y, nmin = 5, nmax = 10) ดังนั้น krige ด้วยการดูที่เพื่อนบ้านอย่างน้อย 5 คนและสูงสุด 10 สิ่งนี้สมเหตุสมผลหรือไม่? ผลลัพธ์เป็นสิ่งที่ดี: dropbox.com/s/7lxvfiyfl7ekhb4/ …
Kasper

ฉันคิดว่าฉันมีปัญหากับการสร้างแบบจำลอง Variogram: ถ้าคุณคิดว่าความสัมพันธ์ไม่มีอะไรเกี่ยวข้องกับระยะทาง แต่กับเพื่อนบ้านที่ใกล้ที่สุด
Kasper

"ถ้าคุณคิดว่าความสัมพันธ์ไม่มีอะไรเกี่ยวข้องกับระยะทาง แต่กับเพื่อนบ้านที่ใกล้ที่สุด" - นั่นไม่น่าสนใจแล้วมันเป็นแบบอินไลน์มากขึ้นด้วยการจำแนก Knn รหัสkrige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)ประมาณการตัวแปรท้องถิ่น เช่นคุณไม่มีรูปสี่เหลี่ยมทั่วทั้งพื้นที่การศึกษา แต่ประเมินโมเดลใหม่สำหรับทุกตำแหน่งที่คุณพยายามคาดการณ์ โมเดลโลคัลจะคว้าเฉพาะ 10 ค่าที่ใกล้ที่สุดเท่านั้น (เนื่องจากคุณไม่ได้ระบุระยะทางสูงสุดมันควรจะคว้า 10 ค่าเสมอดังนั้นจึงnminควรไม่จำเป็น)
Andy W

1
จากนั้นการประมาณค่าตัวแปรย่อยในท้องถิ่นเป็นสิ่งที่ควรทำ หากพวกมันแตกต่างกันไปตามคุณสมบัติบางอย่างรวมถึงตัวทำนายอื่น ๆ ในโมเดลก็เป็นตัวเลือกเช่นกัน IDW อาจถูกพิจารณาว่าเป็นแบบจำลองที่ง่ายที่สุดดังนั้น IDW ไม่ควรจะดีกว่าการประมาณค่าความแปรปรวนจากข้อมูล
Andy W

คำตอบ:


9

บทนำและบทสรุป

กฎหมายภูมิศาสตร์ของ Toblerยืนยัน

ทุกอย่างเกี่ยวข้องกับทุกอย่าง แต่สิ่งที่อยู่ใกล้นั้นมีความเกี่ยวข้องมากกว่าสิ่งที่อยู่ห่างไกล

Krigingใช้รูปแบบของความสัมพันธ์เหล่านั้นซึ่ง

  • "สิ่งต่าง ๆ " เป็นค่าตัวเลขในสถานที่บนพื้นผิวโลก (หรือในอวกาศ) ซึ่งมักจะแสดงเป็นระนาบแบบยุคลิด

  • ค่าตัวเลขเหล่านี้ถือเป็นการรับรู้ของตัวแปรสุ่ม

  • "ที่เกี่ยวข้อง" จะแสดงในแง่ของค่าเฉลี่ยและความแปรปรวนร่วมของตัวแปรสุ่มเหล่านี้

(ชุดของตัวแปรสุ่มที่เกี่ยวข้องกับจุดในอวกาศเรียกว่า "กระบวนการสโตแคสติก ") Variogram ให้ข้อมูลที่จำเป็นในการคำนวณความแปรปรวนร่วมเหล่านั้น

Kriging คืออะไร

Kriging โดยเฉพาะคือการทำนายสิ่งต่างๆในสถานที่ที่พวกเขาไม่ได้สังเกต เพื่อทำให้กระบวนการทำนายทางคณิตศาสตร์สามารถจัดการได้ง่าย Kriging จึง จำกัด สูตรที่เป็นไปได้ให้เป็นฟังก์ชันเชิงเส้นของค่าที่สังเกตได้ นั่นทำให้ปัญหาเป็นหนึ่งในการพิจารณาว่าสัมประสิทธิ์ควรเป็นเท่าไหร่ สิ่งเหล่านี้สามารถพบได้โดยกำหนดให้กระบวนการคาดการณ์มีคุณสมบัติบางอย่าง สังหรณ์ใจสถานที่ให้บริการที่ดีเยี่ยมนั่นคือความแตกต่างระหว่างการทำนายและความจริง ( แต่ไม่ทราบ) ค่าควรมีแนวโน้มที่จะมีขนาดเล็กนั่นคือการทำนายที่ควรจะเป็นได้อย่างแม่นยำ สถานที่ให้บริการซึ่งเป็นที่สูง touted แต่เป็นที่น่าสงสัยมากขึ้นก็คือว่าโดยเฉลี่ยทำนายควรเท่ากับมูลค่าที่แท้จริง: มันควรจะเป็นที่ถูกต้อง

(เหตุผลที่ยืนยันในความแม่นยำที่สมบูรณ์แบบนั้นเป็นที่น่าสงสัย แต่ก็ไม่ได้เลวร้ายเสมอไปนั่นคือมันทำให้กระบวนการทางสถิติมีความแม่นยำน้อยกว่า: นั่นคือแปรปรวนมากขึ้นเมื่อถ่ายภาพที่เป้าหมายคุณต้องการกระจายความนิยมอย่างสม่ำเสมอ ขอบและไม่ค่อยกดปุ่มตรงกลางหรือคุณจะยอมรับผลลัพธ์ที่มุ่งเน้นถัดจาก แต่ไม่ตรงจุดกึ่งกลางเดิมมีความถูกต้อง แต่ไม่แม่นยำในขณะที่หลังไม่ถูกต้อง แต่แม่นยำ)

สมมติฐานและเกณฑ์เหล่านี้ - นั่นหมายถึงและความแปรปรวนร่วมเป็นวิธีที่เหมาะสมในการหาจำนวนความสัมพันธ์ที่ว่าการทำนายเชิงเส้นจะได้ผลและผู้ทำนายควรแม่นยำที่สุดเท่าที่จะเป็นไปได้เพื่อความถูกต้องสมบูรณ์ - นำไปสู่ระบบสมการที่ วิธีการแก้ปัญหาที่ไม่ซ้ำกันมีให้ covariances ที่ได้รับการระบุไว้ในลักษณะที่สอดคล้อง ตัวทำนายที่เกิดขึ้นจึงถูกเรียกว่า "BLUP": ตัวทำนายเชิงเส้นแบบเป็นกลางที่ดีที่สุด

ตำแหน่งของ Variogram เข้ามา

การหาสมการเหล่านี้จำเป็นต้องทำให้โปรแกรมเป็นจริง สิ่งนี้ทำได้โดยการเขียนโควาเรียสระหว่างตัวทำนายและข้อสังเกตที่คิดว่าเป็นตัวแปรสุ่ม พีชคณิตของ covariancesทำให้เกิด covariances ระหว่างค่าสังเกตที่จะเข้าไปในสมการ Kriging เกินไป

เมื่อมาถึงจุดนี้เราถึงจุดจบเพราะความแปรปรวนร่วมเหล่านั้นแทบจะไม่รู้จักเลย ท้ายที่สุดในแอปพลิเคชันส่วนใหญ่เราได้สังเกตเห็นเพียงการสำนึกของตัวแปรสุ่มแต่ละอันเพียงอันเดียวคือชุดข้อมูลของเราซึ่งประกอบด้วยตัวเลขเพียงหนึ่งหมายเลขในแต่ละตำแหน่งที่แตกต่างกัน ใส่ความแปรปรวน: ฟังก์ชันทางคณิตศาสตร์นี้บอกเราว่าความแปรปรวนร่วมระหว่างค่าสองค่าใดควรจะเป็น มันเป็นข้อ จำกัด เพื่อให้มั่นใจว่า covariances เหล่านี้เป็น "สอดคล้อง" (ในความรู้สึกว่ามันจะไม่ให้ชุดของ covariances ว่าเป็นไปไม่ได้ในทางคณิตศาสตร์ A: ไม่ได้คอลเลกชันทั้งหมดของมาตรการเชิงตัวเลขของ "สัมพันธ์" จะฟอร์มเมทริกซ์ความแปรปรวนที่เกิดขึ้นจริง ) นั่นเป็นสาเหตุที่ทำให้การผันแปรเป็นสิ่งจำเป็นสำหรับ Kriging

อ้างอิง

เนื่องจากตอบคำถามทันทีฉันจะหยุดที่นี่ ผู้อ่านที่สนใจสามารถเรียนรู้วิธีการประมาณค่าและตีความรูปแบบต่าง ๆ โดยการให้คำปรึกษาในตำราที่ดีเช่น Journel & Huijbregts ' Mining Geostatistics (1978) หรือ Isaaks & Srivastava's Geostatistics (1989) (หมายเหตุว่ากระบวนการการประมาณค่าแนะนำวัตถุสองเรียกว่า "variograms": การเชิงประจักษ์ variogram ได้จากข้อมูลและรูปแบบ variogram ที่ติดตั้งไปอ้างอิงทั้งหมดถึง "variogram" ในคำตอบนี้คือรูปแบบการเรียกร้องให้.. vgmในคำถาม ส่งคืนการแทนค่าคอมพิวเตอร์ของแบบจำลองแบบจำลอง) สำหรับวิธีการที่ทันสมัยกว่าซึ่งการประมาณค่าแบบย่อยและแบบ Kriging ถูกรวมกันอย่างเหมาะสมดูที่ Diggle &Geostatistics แบบจำลอง (2007) (ซึ่งเป็นคู่มือเพิ่มเติมสำหรับRแพ็คเกจGeoRและGeoRglm)


ความคิดเห็น

ไม่ว่าคุณจะใช้ Kriging สำหรับการทำนายหรืออัลกอริธึมอื่น ๆ การระบุลักษณะเชิงปริมาณของความสัมพันธ์ที่จ่ายโดย Variogram นั้นมีประโยชน์สำหรับการประเมินกระบวนการทำนายใด ๆ ขอให้สังเกตว่าวิธีการแก้ไขเชิงพื้นที่ทั้งหมดเป็นตัวทำนายจากมุมมองนี้และหลายคนเป็นตัวทำนายเชิงเส้นเช่น IDW (ถ่วงน้ำหนักระยะทางผกผัน) สามารถใช้ Variogram เพื่อประเมินค่าเฉลี่ยและการกระจายตัว (ส่วนเบี่ยงเบนมาตรฐาน) ของวิธีการแก้ไขใด ๆ ดังนั้นจึงมีการบังคับใช้ไกลเกินกว่าที่ใช้ใน Kriging


ขอบคุณสำหรับคำตอบโดยละเอียดนี้ ฉันถามคำถามเดียวกันกับข้างต้นจะเกิดอะไรขึ้นถ้าฉันไม่สามารถสันนิษฐานได้ว่าความสัมพันธ์เชิงพื้นที่เป็นอิสระจากที่ตั้ง มันถูกต้องหรือไม่ที่การสร้างแบบจำลอง Variogram นั้นไม่มีประโยชน์อย่างที่ฉันจะต้องทำแบบจำลองของ Variogram สำหรับทุกตำแหน่ง? ถ้าอย่างนั้นจะเป็นการดีกว่าถ้าใช้ IDW
Kasper

เมื่อคุณไม่สามารถสันนิษฐานว่ากระบวนการคงค้างอันดับที่สองของกระบวนการนั้นมีหลายตัวเลือก ได้แก่ (1) การรวบรวมการรับรู้หลาย ๆ กระบวนการ (เมื่อมันแปรผันตามเวลา) (2) การประมาณค่า variograms บน subregions ท้องถิ่น (เมื่อมีข้อมูลจำนวนมาก); และ (3) สมมติว่าเป็นโมเดลพาราเมตริกสำหรับการเปลี่ยนแปลงของตัวแปรที่มีตำแหน่ง (ในรูปแบบ GARCH สำหรับกระบวนการ 1D) ความคิดเห็นล่าสุดของฉันแสดงให้เห็นถึงความไม่เหมาะสมของการย้อนกลับของบางสิ่งบางอย่างเช่น IDW: คุณสามารถประมาณค่าความแปรปรวนได้หรือไม่โดยหลักการแล้วมันมีอยู่จริงหรือไม่
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.