ไตรมาสที่ 1
นักนิเวศวิทยาพูดถึงการไล่ระดับสีตลอดเวลา มีการไล่ระดับสีหลายประเภท แต่อาจเป็นการดีที่สุดถ้าคุณคิดว่ามันเป็นการรวมกันของตัวแปรที่คุณต้องการหรือมีความสำคัญต่อการตอบสนอง ดังนั้นการไล่ระดับสีอาจเป็นเวลาหรือพื้นที่หรือความเป็นกรดของดินหรือสารอาหารหรือสิ่งที่ซับซ้อนกว่าเช่นการรวมกันเชิงเส้นของช่วงของตัวแปรที่ต้องการโดยการตอบสนองในบางวิธี
เราพูดถึงการไล่ระดับสีเพราะเราสังเกตสิ่งมีชีวิตในอวกาศหรือเวลาและโฮสต์ของสิ่งต่าง ๆ ต่างกันไปตามอวกาศหรือเวลานั้น
ไตรมาสที่ 2
ฉันได้ข้อสรุปว่าในหลาย ๆ กรณีเกือกม้าใน PCA ไม่ใช่ปัญหาที่ร้ายแรงหากคุณเข้าใจว่ามันเกิดขึ้นได้อย่างไรและไม่ทำสิ่งที่โง่ ๆ อย่างเอา PC1 เมื่อ "ไล่ระดับ" แทน PC1 และ PC2 ก็ถูกแบ่งออกเป็นพีซีที่สูงขึ้นเช่นกัน แต่หวังว่าการแสดงแบบ 2 มิติก็โอเค)
ในแคลิฟอร์เนียฉันคิดว่าฉันคิดเหมือนกัน (ตอนนี้ต้องถูกบังคับให้คิดเรื่องนี้) วิธีการแก้ปัญหาสามารถสร้างโค้งเมื่อไม่มีมิติที่สองที่แข็งแกร่งในข้อมูลดังกล่าวว่ารุ่นพับของแกนแรกซึ่งตอบสนองความต้องการ orthogonality ของแกน CA อธิบาย "ความเฉื่อย" มากกว่าทิศทางอื่นในข้อมูล นี่อาจจะรุนแรงกว่านี้เนื่องจากโครงสร้างประกอบด้วย PCA ส่วนโค้งเป็นเพียงวิธีในการแสดงความหลากหลายของสิ่งมีชีวิตในพื้นที่ต่างๆในการไล่ระดับสีเดียว
ฉันไม่เคยเข้าใจเลยว่าทำไมผู้คนกังวลมากเกี่ยวกับการสั่งซื้อที่ผิดตาม PC1 พร้อมกับเกือกม้าที่แข็งแกร่ง ฉันจะตอบโต้ว่าคุณไม่ควรใช้ PC1 ในกรณีเช่นนี้และปัญหาจะหายไป คู่ของพิกัดบน PC1 และ PC2 กำจัดการย้อนกลับของหนึ่งในสองแกนเหล่านั้น
ไตรมาสที่ 3
ถ้าฉันเห็นเกือกม้าใน PCA biplot ฉันจะตีความข้อมูลว่ามีการไล่ระดับสีที่โดดเด่นหรือทิศทางของการเปลี่ยนแปลง
ถ้าฉันเห็นซุ้มประตูฉันอาจจะสรุปเหมือนเดิม แต่ฉันจะต้องระวังอย่างมากที่จะพยายามอธิบายแกน CA 2 เลย
ฉันจะไม่ใช้ DCA - มันแค่บิดโค้งออกไป (ในสถานการณ์ที่ดีที่สุด) เช่นที่คุณไม่เห็นสิ่งแปลกประหลาดในแปลง 2 มิติ แต่ในหลาย ๆ กรณีมันสร้างโครงสร้างปลอมอื่น ๆ เช่นเพชรหรือรูปร่างทรัมเป็ตไปที่ การจัดเรียงตัวอย่างในพื้นที่ DCA ตัวอย่างเช่น:
library("vegan")
data(BCI)
plot(decorana(BCI), display = "sites", type = "p") ## does DCA
เราเห็นการพัดจากจุดตัวอย่างทั่วไปไปทางซ้ายของพล็อต
ไตรมาสที่ 4
ม.
สิ่งนี้จะแนะนำให้ค้นหาทิศทางที่ไม่เชิงเส้นในพื้นที่มิติสูงของข้อมูล วิธีการหนึ่งดังกล่าวเป็นเส้นโค้งหลักของ Hastie & Stuezel แต่มีวิธีการอื่น ๆ ที่ไม่เป็นเชิงเส้นที่มีอยู่ซึ่งอาจพอเพียง
ตัวอย่างเช่นสำหรับข้อมูลทางพยาธิวิทยาบางอย่าง
เราเห็นเกือกม้าที่แข็งแกร่ง เส้นโค้งหลักพยายามกู้คืนการไล่ระดับสีพื้นฐานหรือการจัดเรียง / การจัดเรียงตัวอย่างผ่านทางเส้นโค้งเรียบในมิติ m ของข้อมูล รูปด้านล่างแสดงให้เห็นว่าอัลกอริทึมซ้ำ ๆ มาบรรจบกับสิ่งที่ใกล้เคียงกับการไล่ระดับสีพื้นฐาน (ฉันคิดว่ามันห่างจากข้อมูลที่ด้านบนของพล็อตเพื่อให้ใกล้เคียงกับข้อมูลในมิติที่สูงกว่าและส่วนหนึ่งเป็นเพราะเกณฑ์ความมั่นคงของตัวเองสำหรับเส้นโค้งที่จะประกาศเส้นโค้งหลัก)
ฉันมีรายละเอียดเพิ่มเติมรวมถึงรหัสในโพสต์บล็อกของฉันซึ่งฉันถ่ายภาพเหล่านั้น แต่ประเด็นหลักที่นี่คือเส้นโค้งหลักสามารถกู้คืนตัวอย่างที่รู้จักได้อย่างง่ายดายในขณะที่ PC1 หรือ PC2 ด้วยตัวเองไม่ได้
ในกรณี PCA มันเป็นเรื่องธรรมดาที่จะใช้การเปลี่ยนแปลงในระบบนิเวศ การแปลงที่ได้รับความนิยมคือสิ่งที่สามารถนึกถึงการคืนค่าระยะทางแบบยุคลิดที่ไม่ใช่เมื่อคำนวณระยะทางแบบยุคลิดบนข้อมูลที่ถูกแปลง ตัวอย่างเช่นระยะทาง Hellinger คือ
DH อีลิตรลิตรฉันn gอีอาร์( x 1 , x 2 ) = ∑J = 1พี[ y1 เจY1 +----√- y2 เจY2 +----√]2------------------⎷
YฉันเจJผมYฉัน+ผม
เกือกม้าเป็นที่รู้จักและศึกษามานานในระบบนิเวศ วรรณกรรมบางต้น (รวมถึงรูปลักษณ์ที่ทันสมัยกว่า) คือ
- Goodall DW และคณะ (1954) วิธีการที่มีวัตถุประสงค์เพื่อจำแนกพืชพรรณ สาม. การเขียนเรียงความในการใช้งานของการวิเคราะห์ปัจจัย วารสารพฤกษศาสตร์ออสเตรเลีย 2, 304–324
- Noy-Meir I. และ Austin MP และคณะ (1970) ตัวแทนอุปสมบทหลักและจำลองพืชผลข้อมูล นิเวศวิทยา 51, 551–552
- Podani J. และMiklós I. และคณะ (2002) ความคล้ายคลึงค่าสัมประสิทธิ์และผลเกือกในหลักวิเคราะห์พิกัด นิเวศวิทยา 83, 3331–3343
- Swan JMA และคณะ (1970) การตรวจสอบของบางปัญหาการอุปสมบทโดยใช้จำลองพืชผลข้อมูล นิเวศวิทยา 51, 89–102
การอ้างอิงเส้นโค้งหลักที่สำคัญคือ
- De'ath G. et al. (1999) Curves เงินต้น: เทคนิคใหม่สำหรับการวิเคราะห์ลาดทางอ้อมและทางตรง นิเวศวิทยา 80, 2237-2253
- Hastie T. และ Stuetzle W. และคณะ (1989) Curves หลัก วารสารสมาคมสถิติอเมริกัน 84, 502–516
ด้วยอดีตเป็นการนำเสนอทางนิเวศวิทยามาก