คำถามติดแท็ก data-visualization

การสร้างข้อมูลกราฟิกที่เป็นประโยชน์และมีประโยชน์ (หากคำถามของคุณเกี่ยวกับวิธีการรับซอฟต์แวร์เฉพาะเพื่อสร้างเอฟเฟกต์เฉพาะอาจเป็นไปได้ว่าไม่ใช่หัวข้อที่นี่)

2
คุณจะเห็นภาพของช่องทางที่แบ่งกลุ่มอย่างไร (และคุณสามารถใช้กับ Python ได้หรือไม่)
ฉันเห็นโพสต์นี้ใน Moz ซึ่งนำเสนอช่องทางการตลาดที่แบ่งกลุ่ม: สิ่งนี้จะมีค่าค่อนข้างน้อยในงานของฉัน สิ่งที่ฉันไม่มีความคิดก็คือทำอย่างไรจึงจะเห็นภาพข้อมูลดิบเพื่อแสดงช่องทางที่แบ่งกลุ่มแบบนี้ แนวคิดคือยอดขายที่นำมาจากแหล่งต่าง ๆ (ซึ่งเราใช้เพื่อแบ่งกลุ่มข้อมูลตาม) และผ่านหลายขั้นตอนตามเวลาที่พวกเขาเปลี่ยนเป็นดีล จากแต่ละขั้นไปยังอีกบางคนย่อหย่อน ความกว้างของแต่ละชิ้นถูกกำหนดโดยจำนวนนำที่แน่นอนในแต่ละชิ้น [ แก้ไข : สังเกตภาพที่ใช้สำหรับการอ้างอิงที่นี่ทำให้เข้าใจผิดเมื่อมันมาถึงตัวเลขที่ระบุทางด้านขวาของแต่ละชิ้น ดูเหมือนจะไม่มีความสัมพันธ์ระหว่างความกว้างของชิ้นและหมายเลข รูปภาพควรถูกใช้เพื่ออ้างอิงถึงการออกแบบช่องทางแบ่งส่วนเท่านั้น] อย่างไรก็ตามความคิดใด ๆ วิธีการเห็นภาพหรือไม่ ถ้าเป็นไปได้ฉันชอบที่จะมีวิธีใน Python นี่คือGoogle เอกสารที่มีข้อมูลหุ่นหากใครต้องการ ... มองไปข้างหน้าเพื่อข้อมูลเชิงลึกของคุณ ขอบคุณ!

2
คุณวางแผนการปฏิสัมพันธ์ระหว่างปัจจัยและ covariate อย่างต่อเนื่องได้อย่างไร
ฉันต้องการลงจุดบนกราฟเดียวกันการทำงานร่วมกันระหว่างตัวทำนายต่อเนื่องของฉันกับผู้ดูแลหมวดหมู่ของฉัน ฉันรู้ว่าต้องทำอย่างไรเมื่อทั้งสองมีการจัดหมวดหมู่ ( การโต้ตอบระหว่างปัจจัย ) แต่ไม่รู้จริง ๆ ว่าจะทำอย่างไรเมื่อมีการต่อเนื่องและมีการจัดหมวดหมู่

2
ความหมายของการแสดง simplex เป็นพื้นผิวรูปสามเหลี่ยมในการแจกแจง Dirichlet คืออะไร?
ฉันกำลังอ่านจากหนังสือที่แนะนำการแจกแจง Dirchilet แล้วนำเสนอตัวเลขเกี่ยวกับมัน แต่ฉันไม่สามารถเข้าใจตัวเลขเหล่านั้นได้ ฉันแนบรูปที่นี่ที่ด้านล่าง สิ่งที่ฉันไม่เข้าใจคือความหมายของสามเหลี่ยม โดยปกติเมื่อเราต้องการพล็อตฟังก์ชั่นของตัวแปร 2 ตัวคุณใช้ค่าของ var1 และ va2 จากนั้นพล็อตค่าของฟังก์ชั่นค่าของตัวแปรสองตัวนั้น ... ซึ่งให้การสร้างภาพข้อมูลในมิติสามมิติ แต่ที่นี่มี 3 มิติและอีกหนึ่งค่าสำหรับค่าฟังก์ชั่นดังนั้นมันจึงสร้างภาพในพื้นที่ 4D ฉันไม่เข้าใจตัวเลขเหล่านั้น! ฉันหวังว่าบางคนสามารถชี้แจงได้โปรด! แก้ไข: นี่คือสิ่งที่ฉันไม่เข้าใจจากรูปที่ 2.14 ก ดังนั้นเราได้วาดจาก K = 3 dirichlet ตัวอย่างทีต้า (ซึ่งโดยทั่วไปคือเวกเตอร์) นั่นคือ: theta = [theta1, theta2, theta3] สามเหลี่ยมแปลง [theta1, theta2, theta3] ระยะทางจากจุดเริ่มต้นไปยังแต่ละ theta_i คือค่าของ theta_i จากนั้นสำหรับ theta_i แต่ละอันให้ใส่จุดยอดและเชื่อมต่อจุดยอดทั้งสามและทำรูปสามเหลี่ยม ฉันรู้ว่าถ้าฉันเสียบ …

4
มีชื่อสำหรับแผนภูมินี้ - เรียงลำดับของการข้ามระหว่างแผนภูมิวงกลมและพล็อต mekko
มีชื่อของแผนภูมิประเภทนี้ด้านล่าง (ที่มาจากกระทรวงธุรกิจนวัตกรรมและการจ้างงานของนิวซีแลนด์สำหรับคนที่ฉันทำงาน แต่ฉันไม่ได้เกี่ยวข้องกับการสร้างพล็อตนี้)? มันประกอบด้วยสี่เหลี่ยมที่พื้นที่นั้นเป็นสัดส่วนกับตัวแปรและคล้ายกับการข้ามระหว่างแผนภูมิวงกลมพล็อตโมเสคและพล็อต mekko มันอาจใกล้เคียงกับเนื้อเรื่องของ mekko แต่มีความยุ่งยากว่าเราไม่ได้ทำงานกับคอลัมน์ แต่เป็นตัวต่อที่ซับซ้อนมากขึ้น ต้นฉบับดูดีขึ้นเล็กน้อยเนื่องจากมีเส้นขอบสีขาวระหว่างสี่เหลี่ยมสำหรับแต่ละภูมิภาค น่าแปลกที่จริง ๆ แล้วมันทำให้ฉันรู้สึกว่ากราฟิกทางสถิติไม่ได้แย่จนเกินไปแม้ว่ามันจะสามารถปรับปรุงให้ดีขึ้นได้จากการใช้สีที่แมปกับสิ่งที่มีความหมาย รุ่นที่มีประสิทธิภาพแบบโต้ตอบแสดงงบประมาณ 2011 สหรัฐได้ถูกนำมาใช้โดยนิวยอร์กไทม์ส ความท้าทายที่น่าสนใจคือการคิดอัลกอริธึมอัตโนมัติในการวาดและทำให้มันดูสมเหตุสมผลเช่นกัน สี่เหลี่ยมต้องได้รับอนุญาตให้มีอัตราส่วนกว้างยาวต่างกันภายในช่วงที่ยอมรับได้

1
การตีความแปลงไวโอลิน
ฉันกำลังเปรียบเทียบการกระจายของกลุ่มต่าง ๆ โดยใช้แผนการไวโอลิน แต่แหล่งข้อมูลออนไลน์ส่วนใหญ่ที่ฉันพบมีความเกี่ยวข้องกับวิธีการแปลงและการตีความผลลัพธ์ขั้นพื้นฐานมาก (การแปรผันค่ามัธยฐาน ฉันกำลังมองหาตัวอย่างโดยละเอียดที่ฉันสามารถปฏิบัติตามเป็นแนวทางของฉันในการตีความแผนการไวโอลินอย่างถูกต้อง

2
การเชื่อมต่อแบบปรับตัวคืออะไร?
คำถามพื้นฐานของฉันคืออะไร copula แบบปรับได้คืออะไร ฉันมีสไลด์จากงานนำเสนอ (โชคไม่ดีที่ฉันไม่สามารถขอให้ผู้เขียนสไลด์) เกี่ยวกับ Copulae ที่ปรับตัวได้และฉันไม่ได้รับสิ่งนี้หมายถึงการตอบสนอง สิ่งนี้ดีสำหรับอะไร? นี่คือสไลด์: จากนั้นสไลด์จะดำเนินการทดสอบจุดเปลี่ยน ฉันสงสัยว่ามันเกี่ยวข้องกับอะไรและทำไมฉันจึงต้องการสิ่งนี้ในการเชื่อมโยงกับ copulae? สไลด์จบลงด้วยพล็อตพารามิเตอร์โดยประมาณแบบปรับตัวได้: ดูเหมือนว่าจะแสดงว่าการประมาณการของฉันล่าช้า การตีความอื่นใดความเห็นก็ดีมาก!

1
การแสดงผลลัพธ์จากโมเดลคลาสแฝงหลายตัว
ฉันใช้การวิเคราะห์ชั้นแฝงเพื่อจัดกลุ่มตัวอย่างของการสังเกตตามชุดของตัวแปรไบนารี ฉันใช้ R และแพคเกจ poLCA ใน LCA คุณต้องระบุจำนวนกลุ่มที่คุณต้องการค้นหา ในทางปฏิบัติผู้คนมักใช้โมเดลหลายแบบแต่ละคนระบุจำนวนคลาสที่แตกต่างกันแล้วใช้เกณฑ์ต่าง ๆ เพื่อกำหนดว่าคำอธิบายใดที่ "ดีที่สุด" ของข้อมูล ฉันมักจะพบว่ามันมีประโยชน์มากที่จะมองข้ามแบบจำลองต่างๆเพื่อพยายามทำความเข้าใจว่าการสังเกตที่จำแนกในโมเดลที่มี class = (i) นั้นถูกกระจายโดยโมเดลที่มี class = (i + 1) อย่างไร อย่างน้อยที่สุดบางครั้งคุณสามารถค้นหากลุ่มที่แข็งแกร่งมากซึ่งมีอยู่โดยไม่คำนึงถึงจำนวนคลาสในโมเดล ฉันต้องการวิธีสร้างกราฟความสัมพันธ์เหล่านี้เพื่อสื่อสารผลลัพธ์ที่ซับซ้อนเหล่านี้ในเอกสารและเพื่อนร่วมงานที่ไม่ได้มุ่งเน้นเชิงสถิติได้ง่ายขึ้น ฉันคิดว่านี่เป็นเรื่องง่ายมากที่จะทำใน R โดยใช้แพ็คเกจกราฟิกเครือข่ายแบบง่าย ๆ แต่ฉันก็ไม่รู้เหมือนกัน ใครช่วยกรุณาชี้ฉันในทิศทางที่ถูกต้อง ด้านล่างเป็นรหัสในการทำซ้ำชุดข้อมูลตัวอย่าง เวกเตอร์ xi แต่ละอันแสดงถึงการจำแนก 100 การสังเกตการณ์ในแบบจำลองที่มีคลาสที่เป็นไปได้ ฉันต้องการกราฟวิธีการสังเกต (แถว) ย้ายจากชั้นหนึ่งไปอีกชั้นข้ามคอลัมน์ x1 <- sample(1:1, 100, replace=T) x2 <- sample(1:2, 100, …

2
ฉันจะมองเห็นความสำคัญของอินพุตที่แตกต่างกันไปยังการพยากรณ์สำหรับโมเดลที่ไม่ใช่เส้นตรงแบบกล่องดำได้อย่างไร
ฉันกำลังสร้างเครื่องมือพยากรณ์แบบโต้ตอบ (เป็นไพ ธ อน) เพื่อช่วยในการพยากรณ์ที่ทำในองค์กรของฉัน จนถึงปัจจุบันกระบวนการพยากรณ์ได้รับแรงผลักดันจากมนุษย์เป็นส่วนใหญ่โดยนักพยากรณ์จะดูดซึมข้อมูลในเครือข่ายประสาทธรรมชาติของพวกเขาและใช้ความรู้สึกที่ได้เรียนรู้เพื่อคาดการณ์ จากการตรวจสอบการคาดการณ์ระยะยาวและการศึกษาการสร้างแบบจำลองเชิงทำนายที่ฉันทำฉันพบว่าคุณอาจคาดหวัง นักพยากรณ์ที่แตกต่างกันแสดงอคติที่แตกต่างกันผลกระทบของนักทำนายบางคนดูเหมือนจะพูดเกินจริงและคนอื่น ๆ ที่สำคัญดูเหมือนว่าจะถูกเพิกเฉยและโดยทั่วไปประสิทธิภาพของการพยากรณ์นั้นค่อนข้างปานกลาง การคาดการณ์จะยังคงเป็นคู่มือ แต่ฉันกำลังพยายามสร้างเครื่องมือที่มีประโยชน์เพื่อให้นักพยากรณ์ได้ปริมาณที่ดีขึ้นของผลกระทบสัมพัทธ์ของตัวทำนาย นอกจากนี้ยังมีเอฟเฟกต์ที่สำคัญเช่นอิทธิพลตามฤดูกาลที่มักถูกมองข้ามว่าฉันต้องการให้เครื่องมือเน้นไปที่ผู้ใช้ ฉันคาดหวังระดับ backlash และความสงสัยเกี่ยวกับกระบวนการสร้างแบบจำลองจากนักพยากรณ์ 'ที่มีประสบการณ์' บางคน (หลายคนมีความรู้อย่างเป็นทางการเกี่ยวกับสถิติ) ดังนั้นการสื่อสารจึงมีความสำคัญน้อยที่สุดและประสิทธิภาพของตัวแบบในแง่ของ บรรลุการปรับปรุงที่วัดได้ในความถูกต้องของการคาดการณ์ แบบจำลองที่ฉันกำลังพัฒนามีองค์ประกอบถอยหลังอัตโนมัติที่แข็งแกร่งซึ่งบางครั้งก็มีการแก้ไขอย่างมีนัยสำคัญโดยเหตุการณ์ที่แสดงเป็นค่าที่วัดได้ในตัวทำนายบางตัวที่อยู่ในช่วงเวลาที่ไม่ใช่เหตุการณ์ สิ่งนี้สอดคล้องกับโมเดลจิตที่นักพยากรณ์ใช้ ส่วนสำคัญคือความสามารถในการแสดงให้เห็นว่าการวัด 'เหตุการณ์' ใดมีอิทธิพลมากที่สุดในการผลักดันการทำนายออกไปจากค่าการถดถอยอัตโนมัติสำหรับการคาดการณ์ใด ๆ ฉันถ่ายภาพกระบวนการด้วยวิธีนี้ ผู้พยากรณ์ทำนายค่าที่ดีที่สุดของพวกเขาแบบจำลองเสนอสิ่งที่แตกต่างและผู้ทำนายถามว่าทำไม แบบจำลองตอบกลับบางสิ่งเช่น "ดูที่นี่ค่านี้ของตัวทำนายนี้จะเพิ่มค่าการคาดการณ์ในฤดูร้อนถ้าเป็นฤดูหนาวมันจะย้ายไปทางอื่นฉันรู้ว่ามีการวัดอื่น ๆ เหล่านี้ ทีนี้ลองนึกภาพตัวแบบคือการถดถอยเชิงเส้นอย่างง่าย ใคร ๆ ก็จินตนาการได้ว่าการแสดง 'ผล' สัมพัทธ์ของตัวทำนายตามเหตุการณ์โดยการคูณค่าด้วยแบบจำลองประสิทธิภาพร่วมกันและแสดงเป็นแผนภูมิแท่งแบบง่าย แท่งทั้งหมดจากตัวทำนายที่ต่างกันรวมถึงค่าเบี่ยงเบนทั้งหมดจากค่า AR และสิ่งนี้แสดงให้เห็นอย่างชัดเจนและชัดเจนว่าในกรณีนี้มีอิทธิพลอย่างมาก ปัญหาคือกระบวนการคาดการณ์แสดงระดับความไม่เป็นเชิงเส้นในตัวทำนายสูงหรืออย่างน้อยฉันก็ประสบความสำเร็จมากขึ้นกับอัลกอริธึมการเรียนรู้ของเครื่องที่ไม่เป็นเชิงเส้นกล่องดำ (ฟอเรสต์แบบสุ่มและ GBM) ชุดข้อมูลนี้ เป็นการดีที่ฉันต้องการที่จะสามารถเปลี่ยนรูปแบบการทำงาน 'ภายใต้ประทุน' ได้อย่างราบรื่นโดยไม่มีการเปลี่ยนแปลงประสบการณ์ของผู้ใช้ดังนั้นฉันต้องการวิธีการทั่วไปในการแสดงให้เห็นถึงความสำคัญของการวัดที่แตกต่างกันโดยไม่ต้องใช้วิธีเฉพาะ วิธีการปัจจุบันของฉันคือการตั้งค่าผลกระทบเชิงเส้นเสมือนโดยการตั้งค่าทั้งหมดเป็นศูนย์ยกเว้นสำหรับตัวทำนายหนึ่งบันทึกการเบี่ยงเบนที่ทำนายแล้วทำซ้ำสำหรับตัวทำนายทั้งหมดโดยแสดงผลลัพธ์ในแผนภูมิแท่งที่กล่าวถึงข้างต้น …

2
ทำความเข้าใจกับหนวดของ boxplot
ฉันมีคำถามเกี่ยวกับการแปลความหมายของเคราของกล่องสี่เหลี่ยม ฉันได้อ่านข้อความต่อไปนี้: "ที่ด้านบนและด้านล่างของสี่เหลี่ยม" หนวด "แสดงช่วง 1.5 เท่าของระยะห่างระหว่าง 0.25- และ 0.75- ควอนไทล์" แต่ไม่เข้าใจความหมายของ "ระยะทาง" ทั้งหมด . เป็นไปไม่ได้ที่มวลความน่าจะเป็นมีความหมายเนื่องจากระหว่าง 0.25 และ 0.75 quantile เราเห็นได้ชัดว่ามีเปอร์เซ็นต์ของข้อมูลเท่ากันเสมอ แล้วความคิดคืออะไร?

5
เป็นตัวแทนของข้อมูลการทดลอง
ฉันมีข้อโต้แย้งกับที่ปรึกษาของฉันเกี่ยวกับการสร้างภาพข้อมูล เขาอ้างว่าเมื่อแสดงผลการทดลองค่าควรพล็อตด้วย " เครื่องหมาย " เท่านั้นตามที่แสดงในภาพร้อง ในขณะที่เส้นโค้งควรแสดง " แบบจำลอง " เท่านั้น ในทางกลับกันฉันเชื่อว่าเส้นโค้งไม่จำเป็นในหลายกรณีเพื่อความสะดวกในการอ่านตามที่แสดงในภาพที่สองร้อง: ฉันผิดหรืออาจารย์ของฉัน หากภายหลังเป็นกรณีฉันจะไปรอบ ๆ เพื่ออธิบายสิ่งนี้กับเขาได้อย่างไร

4
วิธีพล็อตข้อมูล 20 ปีต่อวันในอนุกรมเวลา
ฉันมีชุดข้อมูลต่อไปนี้: https://dl.dropbox.com/u/22681355/ORACLE.csv และต้องการพล็อตการเปลี่ยนแปลงรายวันใน 'เปิด' ตาม 'วันที่' ดังนั้นฉันจึงทำสิ่งต่อไปนี้: oracle <- read.csv(file="http://dl.dropbox.com/u/22681355/ORACLE.csv", header=TRUE) plot(oracle$Date, oracle$Open, type="l") และฉันได้รับต่อไปนี้: ตอนนี้เห็นได้ชัดว่าไม่ใช่พล็อตที่อร่อยที่สุดเท่าที่เคยมีมาดังนั้นฉันสงสัยว่าวิธีการที่ถูกต้องที่จะใช้เมื่อทำการพล็อตข้อมูลรายละเอียดนั้นคืออะไร?

1
จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร
สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

2
ฉันจะสร้างพล็อตที่คล้ายกับที่สร้างโดย plot.bugs และ plot.jags จาก mcmc.list ได้อย่างไร [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามดังนั้นจึงเป็นหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน2 ปีที่ผ่านมา R ดูเหมือนว่าจะสามารถที่จะมีความสุขเอาท์พุทแปลงสรุปจากbugsและjagsวัตถุที่สร้างขึ้นโดยฟังก์ชั่นR2WinBUGS :: ข้อบกพร่องและR2jags: Jags อย่างไรก็ตามฉันใช้rjagsแพ็คเกจ เมื่อฉันพยายามพล็อตผลลัพธ์ของฟังก์ชันrjags::coda.samplesโดยใช้R2WinBUGS::plot.mcmc.listผลลัพธ์คือพล็อตการวินิจฉัย (ความหนาแน่นของพารามิเตอร์, อนุกรมเวลาของโซ่, ความสัมพันธ์อัตโนมัติ) สำหรับแต่ละพารามิเตอร์ ด้านล่างนี้คือประเภทของพล็อตที่ผมอยากจะผลิตจากกวดวิชาแอนดรูว์เกลแมนของ"วิ่ง WinBuugs และ OpenBugs จาก R" plot.pugsเหล่านี้ถูกผลิตโดยใช้ ปัญหาคือว่าplot.bugsใช้bugsวัตถุเป็นอาร์กิวเมนต์ในขณะที่ใช้เวลาการส่งออกของplot.mcmc.listcoda.samples นี่คือตัวอย่าง (จากcoda.samples): library(rjags) data(LINE) LINE$recompile() LINE.out <- coda.samples(LINE, c("alpha","beta","sigma"), n.iter=1000) plot(LINE.out) สิ่งที่ฉันต้องการก็คือ วิธีสร้างพล็อตสรุปสรุปแบบหน้าเดียวที่คล้ายกับข้อมูลที่คล้ายกับที่สร้างโดย plot.bugs ฟังก์ชั่นที่จะแปลงLINE.outเป็นวัตถุบั๊กหรือ

2
พารามิเตอร์การบูตแบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับรุ่นผสม
ตัดต่อไปนี้จะนำมาจากบทความนี้ ฉันเป็นมือใหม่ในการบู๊ตสแตรปและพยายามที่จะใช้การบู๊ตสแปปปิ้งแบบกึ่งพารามิเตอร์แบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับแบบจำลองเชิงเส้นผสมกับR bootแพ็คเกจ รหัส R นี่คือRรหัสของฉัน: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

7
กำลังมองหาข้อมูลประดิษฐ์ 2D เพื่อแสดงคุณสมบัติของอัลกอริทึมการจัดกลุ่ม
ฉันกำลังมองหาชุดข้อมูลของ 2 มิติดาต้าพอยน์ (แต่ละดาต้าพอยน์เป็นเวกเตอร์ของสองค่า (x, y)) ตามการแจกแจงและรูปแบบที่แตกต่างกัน รหัสเพื่อสร้างข้อมูลดังกล่าวก็จะเป็นประโยชน์ ฉันต้องการใช้พวกเขาเพื่อพล็อต / เห็นภาพว่าอัลกอริทึมการจัดกลุ่มทำงานอย่างไร นี่คือตัวอย่างบางส่วน: ดาวเหมือนข้อมูลคลาวด์ สี่กลุ่มแยกง่ายหนึ่ง เกลียว (ไม่มีคลัสเตอร์) แหวน เมฆสองก้อนที่แยกจากกันแทบจะไม่ สองกลุ่มขนานสร้างเกลียว ... ฯลฯ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.