ฉันสามารถใช้ bootstrapping ได้หรือไม่


10

ขณะนี้ฉันกำลังทำงานกับการประมาณมวลชีวภาพโดยใช้ภาพถ่ายดาวเทียม ฉันจะกำหนดพื้นหลังของคำถามของฉันอย่างรวดเร็วแล้วอธิบายคำถามเชิงสถิติที่ฉันกำลังทำอยู่

พื้นหลัง

ปัญหา

ฉันพยายามประเมินมวลชีวภาพของพื้นที่ในฝรั่งเศส คำตอบของฉันคือความหนาแน่นปริมาตรไม้ไอน้ำ (เป็น ) ซึ่งมากหรือน้อยตามสัดส่วนของชีวมวล (ขึ้นอยู่กับความหนาแน่นของไม้ ... )m3/ha

ตัวแปรอิสระที่ฉันมีคือดัชนีพืชพรรณที่ได้จากการสะท้อนกลับที่วัดได้ในพื้นที่นี้ (ดาวเทียมที่ใช้ในการศึกษาคือ MODIS สำหรับผู้ที่รู้ว่ามัน) ดัชนีเหล่านี้เป็นตัวอย่าง NDVI, EVI ฯลฯ ฉันมีแผนที่ของดัชนีและความละเอียดของแผนที่คือ 250m

มีความสัมพันธ์ที่แข็งแกร่งระหว่างดัชนีเหล่านี้กับปริมาณในป่าชนิดเดียวกัน (ชีวนิเวศและภูมิอากาศ) ดังนั้นฉันจึงพยายามที่จะลดความหนาแน่นของปริมาณเทียบกับตัวบ่งชี้เหล่านี้ (อันที่จริงเวลาของพวกเขา) ในแปลงสินค้าคงคลังที่ฉันรู้ปริมาณ

สินค้าคงเหลือป่าไม้

ปริมาณในแปลงเหล่านี้ประมาณด้วยวิธีการสุ่มตัวอย่างต่อไปนี้:

  1. โหนดสินค้าคงคลังจะถูกวางในตารางปกติที่ครอบคลุมพื้นที่
  2. พล็อตเชื่อมต่อกับแต่ละโหนดและกระบวนการสินค้าคงคลัง (ชนิดต้นไม้ปริมาณความสูงของหลังคาเป็นต้น) เกิดขึ้นในพล็อตนี้ แน่นอนฉันสนใจเฉพาะพล็อตสินค้าคงคลังและค่าดัชนีพืชพรรณของฉันคือค่าของพิกเซลที่มีพล็อต
  3. กระบวนการสินค้าคงคลังในพล็อตมีดังต่อไปนี้:

    http://i.stack.imgur.com/DeHdC.png

    • วัดต้นไม้ที่มีเส้นผ่านศูนย์กลาง> 37.5 ซม. ในวงกลมรัศมี 15 ม
    • วัดต้นไม้ที่มีเส้นผ่านศูนย์กลาง> 22.5 ซม. ในวงกลมรัศมี 9 ม
    • วัดต้นไม้ที่มีเส้นผ่านศูนย์กลาง> 7.5 ซม. ในวงกลมรัศมี 6 ม

จากนั้นคำนวณความหนาแน่นของปริมาตรโดยใช้ปัจจัยการขยาย

สำหรับพล็อตแต่ละครั้งฉันสามารถเข้าถึงข้อมูลสำหรับต้นไม้ที่วัดได้ทั้งหมด

ยิ่งกว่านั้นสำหรับต้นไม้แต่ละต้นฉันมีความไม่แน่นอนเกี่ยวกับปริมาณเนื่องจากการใช้สมการอัลโลเมตริก (ให้เราบอกว่า 10%)

สถิติมีความสำคัญ ...

เพื่อให้การถดถอยของฉันมีความแม่นยำยิ่งขึ้นฉันต้องการความแปรปรวน / CI ของการวัดนี้แต่ละครั้ง ขึ้นอยู่กับจำนวนต้นไม้ที่สุ่มตัวอย่างและปริมาณความหนาแน่นที่พบ

ดังนั้นฉันมีสองปัญหา:

  1. วิธีการบัญชีสำหรับข้อเท็จจริงที่ว่าดัชนีพืชของฉันมีการวัดมากกว่าพิกเซล 250m?

    ฉันสามารถสันนิษฐานได้ว่าความหนาแน่นของปริมาณคงที่มากกว่าหนึ่งพิกเซลและฉันลองพิกเซลนี้ด้วยพล็อตโฆษณาหนึ่งรายการ

  2. จะประเมินความแปรปรวนของความหนาแน่นของโวลุ่มได้อย่างไร

    ฉันคิดว่าฉันสามารถใช้ bootstrapping กับประชากรต้นไม้ แต่จำนวนต้นไม้ที่วัดได้ทั้งหมดของฉันนั้นค่อนข้างเล็ก (จาก 7 ถึง 20 ... ) ยิ่งกว่านั้นฉันจะคำนึงถึงความจริงที่ว่าฉันกำลังวัดต้นไม้ในวงกลมต่าง ๆ ขึ้นอยู่กับขนาดของมันอย่างไร และความแปรปรวนควรเปลี่ยนไปอย่างไรถ้าฉันดูพิกเซลทั้งหมด

ฉันยังคิดว่าฉันสามารถใช้การจำลองแบบมอนติคาร์โลเพื่อจำลองป่าแล้วสุ่มตัวอย่างป่านี้ด้วยแผนการเพื่อดูว่าเกิดอะไรขึ้น ...

ฉันไม่มีภูมิหลังทางสถิติที่แข็งแกร่งดังนั้นฉันจึงแพ้บ้างเล็กน้อย!

คำตอบ:


1

ฉันไม่เข้าใจข้อมูลของคุณเป็นอย่างดี แต่ฉันสามารถบอกคุณได้ว่าทางเลือกอื่นสำหรับ bootstrap แบบมัลติโนเมียลที่ทำงานได้ดีกว่าสำหรับเหตุการณ์ที่หายากคือการก่อกวน / bootstrap ป่า การแพร่กระจายนั้นมีความยืดหยุ่นอย่างมากและมักจะสามารถจัดการกับข้อมูลที่ไม่ใช่ iid ได้อย่างไรก็ตามบางครั้งจำเป็นต้องใช้กลเม็ดในการคำนวณ cdf ให้ถูกต้อง หากคุณประสบความสำเร็จในการระบุสูตร bootstrap อย่างถูกต้องคุณจะมีสมมติฐานน้อยลงและมีแนวโน้มที่จะลำเอียงน้อยกว่าวิธีการปรับให้เรียบก่อนหน้านี้โดยเฉพาะอย่างยิ่งเมื่อได้รับชุดข้อมูลที่กระจัดกระจาย


0

ถ้าฉันต้องเข้าหาปัญหานี้ฉันจะเริ่มด้วย:

  1. ดูแผนที่ของแหล่งข้อมูล
  2. พยายามทำให้ผิวเรียบ 2d บนพื้นผิวลองแจ้งด้วย AIC
  3. คำนวณอนุพันธ์ของความลื่นไหลที่ตำแหน่งและสัมพันธ์กับความแปรปรวนในอินพุตกับความแปรปรวนของเอาต์พุตโดยใช้วิธีเดลต้า
  4. เปรียบเทียบผลลัพธ์ของสิ่งนี้กับค่า "รู้จัก" บางอย่างเพื่อตรวจสอบ / ตรวจสอบความถูกต้องของวิธีการ

ลิงค์ที่เกี่ยวข้อง: http://www.stanford.edu/class/cme308/notes/TaylorAppDeltaMethod.pdf http://www.ingentaconnect.com/content/klu/stco/2010/00000020/00000004/00009140?crawler=true

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.