คำถามติดแท็ก spatial

สาขาการศึกษาที่เกี่ยวข้องกับวิธีการทางสถิติที่ใช้พื้นที่และความสัมพันธ์เชิงพื้นที่ (เช่นระยะทางพื้นที่ปริมาตรความยาวความสูงการวางแนวศูนย์กลางและ / หรือลักษณะเชิงพื้นที่อื่น ๆ ของข้อมูล) โดยตรงในการคำนวณทางคณิตศาสตร์ของพวกเขา

2
คำถามเกี่ยวกับการถดถอยโลจิสติก
ฉันต้องการรันการถดถอยโลจิสติกแบบไบนารีเพื่อสร้างแบบจำลองการมีหรือไม่มีความขัดแย้ง (ตัวแปรตาม) จากชุดของตัวแปรอิสระในช่วง 10 ปี (1997-2006) โดยแต่ละปีมีการสังเกต 107 ครั้ง ที่ปรึกษาของฉันคือ: การเสื่อมสภาพของดิน (แบ่งเป็น 2 ประเภทคือการย่อยสลาย); จำนวนประชากรเพิ่มขึ้น (0- no; 1-yes); ประเภทการดำรงชีวิต (0 - ประเภทหนึ่ง; 1 - ประเภทสอง); ความหนาแน่นของประชากร (ความหนาแน่นสามระดับ); NDVIอย่างต่อเนื่อง (ผลผลิตสูงสุด veg); NDVI t - 1 (ลดลง veg จากปีก่อน - 0 - no; 1 -yes) และt - 1เสื้อ-1_{t-1} และ NDVI (การลดลงของ veg …

3
การวัดทางสถิติหากภาพประกอบด้วยพื้นที่ที่เชื่อมต่อกันเป็นอวกาศ
ลองพิจารณาภาพระดับสีเทาทั้งสองนี้: ภาพแรกแสดงรูปแบบแม่น้ำที่คดเคี้ยว ภาพที่สองแสดงสัญญาณรบกวนแบบสุ่ม ฉันกำลังมองหาการวัดทางสถิติที่ฉันสามารถใช้เพื่อตรวจสอบว่าเป็นไปได้หรือไม่ที่ภาพแสดงรูปแบบของแม่น้ำ ภาพแม่น้ำมีสองพื้นที่: แม่น้ำ = ค่าสูงและอื่น ๆ = ค่าต่ำ ผลลัพธ์คือฮิสโตแกรมนั้นมีค่า bimodal: ดังนั้นรูปภาพที่มีลวดลายของแม่น้ำควรมีความแปรปรวนสูง อย่างไรก็ตามภาพสุ่มด้านบน: River_var = 0.0269, Random_var = 0.0310 ในทางตรงกันข้ามภาพสุ่มมีความต่อเนื่องของพื้นที่ต่ำในขณะที่ภาพแม่น้ำมีความต่อเนื่องของพื้นที่สูงซึ่งแสดงให้เห็นอย่างชัดเจนในรูปแบบการทดลองที่หลากหลาย: ในทำนองเดียวกันความแปรปรวน "สรุป" ฮิสโตแกรมในตัวเลขหนึ่งฉันกำลังมองหาตัวชี้วัดเชิงพื้นที่ที่ "สรุป" ตัวแปรทดลอง ฉันต้องการให้มาตรการนี้ "ลงโทษ" ความผันแปรสูงที่ความล่าช้าเล็ก ๆ หนักกว่าความล่าช้าใหญ่ดังนั้นฉันจึงได้คิด: s v a r = ∑nh = 1γ( h ) / h2 svar=∑h=1nγ(h)/h2\ svar = \sum_{h=1}^n \gamma(h)/h^2 ถ้าฉันเพิ่มจาก …

2
ตัวแบบสำหรับการประมาณความหนาแน่นของประชากร
ฐานข้อมูลของ (ประชากรพื้นที่รูปร่าง) สามารถใช้ในการทำแผนที่ความหนาแน่นของประชากรโดยกำหนดค่าคงที่ของประชากร / พื้นที่ให้กับแต่ละรูปร่าง อย่างไรก็ตามประชากรมักไม่กระจายอย่างสม่ำเสมอภายในรูปหลายเหลี่ยม การทำแผนที่ Dasymetricเป็นกระบวนการของการปรับการประเมินความหนาแน่นเหล่านี้โดยใช้ข้อมูลเสริม มันเป็นปัญหาที่สำคัญในสังคมศาสตร์ตามที่รีวิวล่าสุดระบุ สมมติว่าเรามีแผนที่เสริมของที่ดินปกคลุม (หรือปัจจัยอื่นใดที่ไม่ต่อเนื่อง) ในกรณีที่ง่ายที่สุดเราสามารถใช้พื้นที่ที่ไม่สามารถอยู่อาศัยได้อย่างเห็นได้ชัดเช่นแหล่งน้ำเพื่อแยกแยะว่าประชากรไม่ได้อยู่ที่ใดและกำหนดประชากรทั้งหมดให้กับพื้นที่ที่เหลือ โดยทั่วไปแต่ละหน่วยสำรวจสำมะโนประชากรของจะแกะสลักเป็นkส่วนมีพื้นที่ผิวx J ฉัน , ฉัน= 1 , 2 , ... , k ชุดข้อมูลของเราจะถูกเพิ่มเข้าไปในรายการของ tuplesJjjkkkxJ ฉันxjix_{ji}i = 1 , 2 , … , ki=1,2,…,ki = 1, 2, \ldots, k ( yJ, xj 1, xj 2, … , xj k)(yj,xj1,xj2,…,xjk)(y_{j}, …

1
การถดถอยเชิงเส้นและความสัมพันธ์เชิงพื้นที่
ฉันต้องการทำนายความสูงของต้นไม้ในบางพื้นที่โดยใช้ตัวแปรบางอย่างที่ได้จากการรับรู้จากระยะไกล เช่นชีวมวลโดยประมาณ ฯลฯ ฉันต้องการใช้การถดถอยเชิงเส้นก่อน (ฉันรู้ว่ามันไม่ใช่ความคิดที่ดีที่สุด แต่มันเป็นขั้นตอนที่ต้องทำสำหรับโครงการของฉัน) ฉันต้องการทราบว่าการปรับตัวสัมพันธ์สัมพันธ์เชิงพื้นที่อัตโนมัติมีผลกระทบอย่างไรและมีวิธีที่ง่ายที่สุดในการแก้ไขปัญหานี้หากเป็นไปได้ ฉันทำทุกอย่างตามวิธี R

2
การวิเคราะห์เชิงสำรวจของข้อผิดพลาดการพยากรณ์เชิงพื้นที่
ข้อมูล:ฉันทำงานเมื่อเร็ว ๆ นี้ในการวิเคราะห์คุณสมบัติสุ่มของเขตข้อมูลเชิงพื้นที่ของข้อผิดพลาดการคาดการณ์การผลิตพลังงานลม อย่างเป็นทางการอาจกล่าวได้ว่าเป็นกระบวนการ จัดทำดัชนีสองครั้งในเวลา (ด้วยและ ) และหนึ่งครั้งในอวกาศ ( ) โดยที่เป็นจำนวนของการมองไปข้างหน้าครั้ง (เท่ากับบางสิ่งรอบตัว , สุ่มตัวอย่างอย่างสม่ำเสมอ),คือจำนวน "เวลาคาดการณ์" (เช่นเวลาที่มีการออกการคาดการณ์ประมาณ 30,000 ในกรณีของฉันสุ่มตัวอย่างเป็นประจำ) และ thpH24Tn( ϵพีt + h | เสื้อ)t = 1 … , T;h = 1 , … , H,p = p1, … , pn(ϵt+h|tp)t=1…,T;h=1,…,H,p=p1,…,pn \left (\epsilon^p_{t+h|t} \right )_{t=1\dots,T;\; h=1,\dots,H,\;p=p_1,\dots,p_n}เสื้อttชั่วโมงhhพีppHHH242424TTTnnnเป็นจำนวนตำแหน่งเชิงพื้นที่ (ไม่ gridded ประมาณ 300 …

1
นัยสำคัญทางสถิติของความแตกต่างระหว่างระยะทาง
ฉันมีเวกเตอร์มากกว่า 3,000 ตัวบนกริดสองมิติพร้อมการกระจายแบบไม่ต่อเนื่องโดยประมาณ เวกเตอร์คู่หนึ่งตอบสนองเงื่อนไขที่แน่นอน หมายเหตุ: เงื่อนไขนี้ใช้ได้กับคู่เวกเตอร์เท่านั้นไม่ใช่กับเวกเตอร์แต่ละตัว ฉันมีรายการประมาณ 1,500 คู่ดังกล่าวลองเรียกมันว่ากลุ่ม 1 กลุ่มที่ 2 มีคู่เวกเตอร์อื่น ๆ ทั้งหมด ฉันต้องการตรวจสอบว่าระยะห่างระหว่างเวกเตอร์ในคู่ในกลุ่ม 1 นั้นมีขนาดเล็กกว่าระยะทางเฉลี่ยระหว่างสองเวกเตอร์หรือไม่ ฉันจะทำสิ่งนั้นได้อย่างไร การทดสอบทางสถิติ : ทฤษฎีบทขีด จำกัด กลางสามารถใช้กับกรณีของฉันได้หรือไม่? นั่นคือฉันสามารถใช้ตัวอย่างระยะทางและใช้การทดสอบ t ของนักเรียนเพื่อเปรียบเทียบวิธีของตัวอย่างที่ปฏิบัติตามเงื่อนไขด้วยวิธีการตัวอย่างที่ไม่ตรงตามเงื่อนไขหรือไม่ มิฉะนั้นการทดสอบทางสถิติใดที่เหมาะสมที่นี่ ขนาดตัวอย่างและจำนวนตัวอย่าง : ฉันเข้าใจว่ามีสองตัวแปรที่นี่สำหรับแต่ละกลุ่มสองฉันต้องใช้ตัวอย่างnขนาดmและหาค่าเฉลี่ยของตัวอย่างแต่ละตัวอย่าง มีวิธีใดหลักการในการเลือกnและm ? พวกเขาควรมีขนาดใหญ่ที่สุด หรือควรให้น้อยที่สุดเท่าที่จะเป็นไปได้ตราบใดที่พวกเขาแสดงนัยสำคัญทางสถิติ? พวกเขาควรจะเหมือนกันสำหรับแต่ละกลุ่มหรือไม่ หรือควรใหญ่กว่าสำหรับกลุ่ม 2 ซึ่งมีจำนวนคู่เวกเตอร์มากกว่านี้

2
การจัดกลุ่มข้อมูลเชิงพื้นที่ใน R
ฉันมีชุดข้อมูลอุณหภูมิพื้นผิวทะเล (SST) รายเดือนและฉันต้องการใช้วิธีการคลัสเตอร์บางอย่างเพื่อตรวจหาภูมิภาคที่มีรูปแบบ SST ที่คล้ายกัน ฉันมีชุดของไฟล์ข้อมูลรายเดือนที่ใช้งานตั้งแต่ปี 1985 ถึง 2009 และต้องการใช้การจัดกลุ่มกับแต่ละเดือนเป็นขั้นตอนแรก แต่ละไฟล์มีข้อมูลที่ gridded สำหรับ 3,584,16 จุดที่ประมาณ 50% เป็นที่ดินและมีการทำเครื่องหมายด้วยค่า 99.99 ที่จะเป็น NA รูปแบบข้อมูลคือ: lon lat sst -10.042 44.979 12.38 -9.998 44.979 12.69 -9.954 44.979 12.90 -9.910 44.979 12.90 -9.866 44.979 12.54 -9.822 44.979 12.37 -9.778 44.979 12.37 -9.734 44.979 12.51 -9.690 44.979 …
12 r  clustering  spatial 

1
อะไรทำให้รูปแบบตัว U อยู่ในความสัมพันธ์เชิงพื้นที่?
ฉันสังเกตเห็นในงานของฉันเองแบบนี้เมื่อตรวจสอบความสัมพันธ์เชิงพื้นที่ที่ระยะทางที่แตกต่างกันรูปแบบรูปตัวยูในความสัมพันธ์ที่โผล่ออกมา โดยเฉพาะอย่างยิ่งความสัมพันธ์เชิงบวกที่แข็งแกร่งที่ถังขยะขนาดเล็กลดลงตามระยะทางจากนั้นไปถึงหลุมที่จุดใดจุดหนึ่งแล้วไต่กลับขึ้นไป นี่คือตัวอย่างจากบล็อกอนุรักษ์ระบบนิเวศน์Macroecology สนามเด็กเล่น (3) - อัตเชิงพื้นที่ ความสัมพันธ์เชิงบวกที่เป็นบวกอัตโนมัติที่แข็งแกร่งเหล่านี้ในระยะทางที่ใหญ่กว่านั้นเป็นการละเมิดกฎข้อแรกของภูมิศาสตร์ภูมิศาสตร์ของ Tobler ดังนั้นฉันจึงคาดว่าจะเกิดจากรูปแบบอื่นในข้อมูล ฉันคาดหวังว่าพวกเขาจะถึงศูนย์ในระยะทางที่แน่นอนจากนั้นเลื่อนเมาส์ไปรอบ ๆ 0 ที่ระยะทางไกลกว่า (ซึ่งเป็นสิ่งที่เกิดขึ้นโดยทั่วไปในชุดอนุกรมเวลาที่มีคำสั่ง AR หรือ MA ต่ำ) หากคุณทำการค้นหารูปภาพของ Googleคุณสามารถค้นหาตัวอย่างอื่น ๆ ของรูปแบบประเภทเดียวกันนี้ได้ (ดูตัวอย่างอื่นที่นี่ได้ที่นี่ ) ผู้ใช้บนไซต์ GIS ได้โพสต์สองตัวอย่างที่รูปแบบปรากฏสำหรับ Moran I แต่ไม่ปรากฏสำหรับ Geary C ( 1 , 2 ) ร่วมกับงานของฉันเองรูปแบบเหล่านี้สามารถสังเกตได้จากข้อมูลต้นฉบับ แต่เมื่อปรับโมเดลให้เหมาะสมกับเงื่อนไขเชิงพื้นที่และตรวจสอบสิ่งตกค้างที่เหลือพวกมันจะไม่ปรากฏตัว ฉันไม่ได้เจอตัวอย่างในการวิเคราะห์อนุกรมเวลาที่แสดงพล็อต ACF ที่คล้ายกันดังนั้นฉันไม่แน่ใจว่ารูปแบบใดในข้อมูลดั้งเดิมจะทำให้เกิดสิ่งนี้ Scortchi ในความคิดเห็นนี้คาดการณ์ว่ารูปแบบไซน์ อาจเกิดจากรูปแบบตามฤดูกาลที่ถูกละเว้นในซีรีส์เวลานั้น แนวโน้มเชิงพื้นที่ประเภทเดียวกันอาจทำให้เกิดรูปแบบนี้ในรูปคู่เชิงพื้นที่ได้หรือไม่ หรือมันเป็นสิ่งประดิษฐ์อื่น ๆ ของวิธีการคำนวณความสัมพันธ์? …

2
เหตุใดโมแรนฉันจึงไม่เท่ากับ“ -1” ในรูปแบบจุดกระจายอย่างสมบูรณ์แบบ
วิกิพีเดียผิด ... หรือฉันไม่เข้าใจ วิกิพีเดีย:สี่เหลี่ยมสีขาวและสีดำ ("รูปแบบหมากรุก") จะแยกย้ายกันอย่างสมบูรณ์แบบดังนั้นโมแรนฉันจะเป็น −1 หากสี่เหลี่ยมสีขาวซ้อนกันครึ่งหนึ่งของกระดานและสี่เหลี่ยมสีดำอยู่อีกอันหนึ่งโมแรนฉันจะเข้าใกล้ +1 การจัดเรียงสีแบบสุ่มจะทำให้ค่าของ Moran I ใกล้เคียงกับ 0 # Example data: x_coor<-rep(c(1:8), each=8) y_coor<-rep(c(1:8), length=64) my.values<-rep(c(1,0,1,0,1,0,1,0,0,1,0,1,0,1,0,1), length=64) rbPal <- colorRampPalette(c("darkorchid","darkorange")) my.Col <- rbPal(10)[as.numeric(cut(my.values,breaks = 10))] # plot the point pattern... plot(y_coor,x_coor,col = my.Col, pch=20, cex=8, xlim=c(0,9),ylim=c(0,9)) ดังนั้นอย่างที่คุณเห็นจุดต่าง ๆ กระจัดกระจายอย่างสมบูรณ์แบบ # Distance matrix my.dists <- …

3
การประมาณค่าพารามิเตอร์สำหรับกระบวนการเชิงพื้นที่
ฉันได้รับตารางของค่าจำนวนเต็มบวก ตัวเลขเหล่านี้แสดงถึงความเข้มที่ควรสอดคล้องกับความแข็งแกร่งของความเชื่อของบุคคลที่ครอบครองตำแหน่งกริดนั้น (ค่าที่สูงกว่าหมายถึงความเชื่อที่สูงกว่า) โดยทั่วไปแล้วคน ๆ หนึ่งจะมีอิทธิพลเหนือเซลล์กริดหลายเซลล์n×nn×nn\times n ฉันเชื่อว่ารูปแบบของความเข้มควร "ดูเกาส์เซียน" ในที่นั้นจะมีที่ตั้งกลางของความเข้มสูงและจากนั้นความเข้มจะลดลงอย่างรุนแรงในทุกทิศทาง โดยเฉพาะฉันต้องการสร้างแบบจำลองค่าที่มาจาก "Gaussian แบบปรับขนาด" พร้อมพารามิเตอร์สำหรับความแปรปรวนและอีกแบบสำหรับตัวประกอบสเกล มีสองปัจจัยที่ซับซ้อน: การไม่มีบุคคลจะไม่สอดคล้องกับค่าศูนย์เนื่องจากเสียงพื้นหลังและเอฟเฟกต์อื่น ๆ แต่ค่าควรน้อยกว่า พวกมันอาจเอาแน่เอานอนไม่ได้และในการประมาณครั้งแรกอาจเป็นการยากที่จะจำลองแบบเสียงเกาส์แบบง่าย ช่วงความเข้มอาจแตกต่างกันไป สำหรับอินสแตนซ์หนึ่งค่าอาจอยู่ในช่วงระหว่าง 1 ถึง 10 และในอีกกรณีระหว่าง 1 ถึง 100 ฉันกำลังมองหากลยุทธ์การประมาณค่าพารามิเตอร์ที่เหมาะสมหรือตัวชี้ไปยังเอกสารที่เกี่ยวข้อง ชี้ให้เห็นว่าทำไมฉันถึงเข้าถึงปัญหานี้ในทางที่ผิดทั้งหมดก็จะได้รับการชื่นชม :) ฉันได้อ่านเกี่ยวกับกระบวนการ kriging และ Gaussian แล้ว แต่ดูเหมือนว่าเป็นเครื่องจักรที่หนักมากสำหรับปัญหาของฉัน

1
วิธีที่เหมาะสมในการคำนวณความหนาแน่นของเคอร์เนลจากพิกัดทางภูมิศาสตร์คืออะไร?
ฉันต้องคำนวณการประมาณความหนาแน่นเคอร์เนล 2d (kde) จากรายการพิกัดละติจูดและลองจิจูด แต่ละติจูดหนึ่งองศานั้นไม่ได้อยู่ในระยะเดียวกันกับลองจิจูดหนึ่งองศาซึ่งหมายความว่าเมล็ดของแต่ละบุคคลจะเป็นรูปวงรีโดยเฉพาะยิ่งไปกว่านั้นจุดนั้นมาจากเส้นศูนย์สูตร ในกรณีของฉันคะแนนทั้งหมดอยู่ใกล้กันพอที่จะเปลี่ยนเป็นโลกเรียบไม่ควรทำให้เกิดปัญหามากมาย อย่างไรก็ตามฉันยังสงสัยว่าควรจัดการอย่างเหมาะสมอย่างไรในกรณีที่ไม่เป็นจริง

2
ความสัมพันธ์อัตโนมัติเชิงพื้นที่สำหรับข้อมูลอนุกรมเวลา
ฉันมีชุดข้อมูล 20 ปีของการนับจำนวนปีของสายพันธุ์ที่อุดมสมบูรณ์สำหรับชุดรูปหลายเหลี่ยม (~ 200 รูปหลายเหลี่ยมที่ต่อเนื่องและมีรูปร่างไม่สม่ำเสมอ) ฉันใช้การวิเคราะห์การถดถอยเพื่ออนุมานแนวโน้ม (การเปลี่ยนแปลงจำนวนต่อปี) สำหรับรูปหลายเหลี่ยมแต่ละรูปรวมถึงการรวมข้อมูลรูปหลายเหลี่ยมตามขอบเขตการจัดการ ฉันแน่ใจว่ามีข้อมูลเชิงพื้นที่สัมพันธ์อัตโนมัติซึ่งแน่นอนว่าจะส่งผลกระทบต่อการวิเคราะห์การถดถอยสำหรับข้อมูลรวม คำถามของฉันคือ - ฉันจะรันการทดสอบ SAC สำหรับข้อมูลอนุกรมเวลาได้อย่างไร ฉันต้องดู SAC ​​ของส่วนที่เหลือจากการถดถอยของฉันในแต่ละปี (โมแรนระดับโลกของฉัน) หรือไม่? หรือฉันสามารถทำการทดสอบหนึ่งครั้งกับทุกปีได้หรือไม่? เมื่อฉันทดสอบว่าใช่มี SAC มีวิธีง่าย ๆ ในการจัดการเรื่องนี้หรือไม่? พื้นหลังสถิติของฉันมีน้อยและทุกอย่างที่ฉันได้อ่านในการสร้างแบบจำลองเชิงพื้นที่มีความซับซ้อนมาก ฉันรู้ว่า R มีฟังก์ชั่น autocovariate ทางไกล - นี่ใช้ง่ายไหม? ฉันค่อนข้างสับสนในการประเมิน / addess SAC สำหรับปัญหานี้และจะขอบคุณคำแนะนำลิงก์หรือการอ้างอิงใด ๆ ขอบคุณล่วงหน้า!

3
ค้นหาจุด GPS เฉลี่ย
ฉันต้องเขียนโปรแกรมเพื่อค้นหาจุด GPS เฉลี่ยจากประชากรของจุด ในทางปฏิบัติสิ่งต่อไปนี้เกิดขึ้น: ในแต่ละเดือนบุคคลจะบันทึกจุด GPS ของสินทรัพย์คงที่เดียวกัน เนื่องจากลักษณะของ GPS คะแนนเหล่านี้แตกต่างกันเล็กน้อยในแต่ละเดือน บางครั้งคนทำผิดบันทึกการทดสอบผิดในตำแหน่งที่แตกต่างอย่างสิ้นเชิง จุด GPS แต่ละจุดมีน้ำหนักที่แน่นอน ( HDOP ) ซึ่งระบุว่าข้อมูล GPS ปัจจุบันนั้นแม่นยำแค่ไหน จุด GPS ที่มีค่า HDOP ที่ดีกว่าเป็นที่ต้องการมากกว่าจุดต่ำ ฉันจะตรวจสอบสิ่งต่อไปนี้ได้อย่างไร: จัดการกับข้อมูลที่มี 2 ค่าเทียบกับค่าเดียวเช่นอายุ (ค้นหาอายุเฉลี่ยในประชากรของผู้คน) กำหนดค่าผิดปกติ ในตัวอย่างด้านล่างนี้จะเป็น [-28.252, 25.018] และ [-28.632, 25.219] หลังจากไม่รวมค่าผิดปกติให้หาจุด GPS เฉลี่ยในจุดนี้อาจเป็น [-28.389, 25.245] มันจะเป็นโบนัสถ้าสามารถทำงาน "น้ำหนัก" ที่จัดทำโดยค่า HDOP สำหรับแต่ละจุด
11 outliers  spatial 

1
R / mgcv: เพราะเหตุใดผลิตภัณฑ์ te () และ ti () เทนเซอร์จึงให้พื้นผิวที่แตกต่างกัน
mgcvแพคเกจสำหรับการRมีสองฟังก์ชั่นสำหรับการปฏิสัมพันธ์กระชับเมตริกซ์ผลิตภัณฑ์: และte() ti()ฉันเข้าใจการแบ่งขั้นพื้นฐานของการใช้แรงงานระหว่างคนทั้งสอง (ปรับให้เหมาะสมกับการทำงานแบบไม่เป็นเชิงเส้นเปรียบเทียบกับการย่อยสลายการโต้ตอบนี้เป็นผลกระทบหลักและการโต้ตอบ) สิ่งที่ฉันไม่เข้าใจคือสาเหตุte(x1, x2)และti(x1) + ti(x2) + ti(x1, x2)อาจให้ผลลัพธ์ที่แตกต่าง (เล็กน้อย) MWE (ดัดแปลงมาจาก?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

3
วัดความสม่ำเสมอของการกระจายของคะแนนในรูปแบบ 2 มิติ
ฉันมีสแควร์ 2 มิติและมีชุดของจุดอยู่ข้างในนั้นพูด 1,000 จุด ฉันต้องการวิธีที่จะดูว่าการกระจายของจุดภายในจัตุรัสนั้นกระจายออกไป (หรือมากกว่าหรือน้อยกว่าการกระจายอย่างสม่ำเสมอ) หรือพวกเขามีแนวโน้มที่จะรวมตัวกันในบางจุดภายในจัตุรัส ฉันต้องการวิธีการทางคณิตศาสตร์ / สถิติ (ไม่ใช่การเขียนโปรแกรม) เพื่อตรวจสอบสิ่งนี้ ฉัน googled พบสิ่งที่ชอบความดีของ Kolmogorov และอื่น ๆ และเพียงแค่สงสัยว่ามีวิธีการอื่นเพื่อให้บรรลุนี้ ต้องการสิ่งนี้สำหรับกระดาษสำหรับชั้นเรียน อินพุต: จตุรัส 2D และ 1,000 คะแนน เอาท์พุท: ใช่ / ไม่ (ใช่ = กระจายออกไปอย่างสม่ำเสมอไม่ = รวมตัวกันในบางจุด)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.