@Ondrej และ @Michelle ได้ให้ข้อมูลที่ดีบางอย่างที่นี่ ฉันสงสัยว่าฉันสามารถมีส่วนร่วมด้วยการพูดถึงประเด็นที่ไม่ได้กล่าวถึงในที่อื่น ฉันจะไม่เอาชนะตัวเองเกี่ยวกับการไม่สามารถรวบรวมข้อมูลจากรูปแบบตารางได้มากโดยทั่วไปตารางจะไม่เป็นวิธีที่ดีในการนำเสนอข้อมูล (เช่นGelman et al., การเปลี่ยนตารางเป็นกราฟ ) ในทางกลับกันการขอเครื่องมือที่จะสร้างกราฟที่ถูกต้องทั้งหมดโดยอัตโนมัติเพื่อช่วยให้คุณสำรวจชุดข้อมูลใหม่เกือบจะเหมือนกับการขอเครื่องมือที่จะทำให้คุณคิด (อย่าเข้าใจผิดว่าฉันรู้ว่าคำถามของคุณชัดเจนว่าคุณไม่ได้ไปไกลขนาดนั้นฉันแค่หมายความว่าจะไม่มีเครื่องมือจริงๆ) การสนทนาที่ดีที่เกี่ยวข้องกับสิ่งนี้สามารถพบได้ที่นี่
สิ่งเหล่านี้ได้รับการกล่าวว่าฉันต้องการพูดคุยเล็กน้อยเกี่ยวกับชนิดของแปลงที่คุณอาจต้องการใช้ในการสำรวจข้อมูลของคุณ พล็อตที่แสดงในคำถามจะเป็นการเริ่มต้นที่ดี แต่เราอาจสามารถเพิ่มประสิทธิภาพได้เล็กน้อย ในการเริ่มต้นด้วยการสร้าง "พล็อตจำนวนมาก" คู่ของตัวแปรที่มีความสัมพันธ์อาจไม่เหมาะ Scatterplot แสดงความสัมพันธ์ของส่วนต่างระหว่างสองตัวแปรเท่านั้น ความสัมพันธ์ที่สำคัญมักถูกซ่อนอยู่ในชุดค่าผสมของตัวแปรหลายตัว ดังนั้นวิธีแรกที่จะพัฒนาวิธีนี้คือการสร้างเมทริกซ์กระจายที่แสดง scatterplots แบบ pairwise ทั้งหมดพร้อมกัน การฝึกอบรม Scatterplot สามารถปรับปรุงได้หลายวิธี: เช่นพวกเขาสามารถรวมกับแปลงความหนาแน่นของเคอร์เนลที่ไม่เปลี่ยนแปลงตัวแปรของการกระจายของตัวแปรแต่ละตัวสามารถใช้เครื่องหมาย / สีที่แตกต่างกันในการวางแผนกลุ่มต่าง ๆ และสามารถประเมินความสัมพันธ์แบบไม่เชิงเส้นได้ scatterplot.matrix
ฟังก์ชั่นในแพคเกจรถใน R สามารถทำทุกสิ่งเหล่านี้เป็นอย่างดี (ตัวอย่างสามารถมองเห็นลงครึ่งหนึ่งหน้าเชื่อมโยงดังกล่าว)
อย่างไรก็ตามในขณะที่การฝึกอบรม scatterplot เป็นการเริ่มต้นที่ดีพวกเขายังคงแสดงเฉพาะส่วนที่ยื่นออกมา มีสองสามวิธีในการพยายามก้าวข้ามสิ่งนี้ หนึ่งคือการสำรวจแปลงสามมิติโดยใช้แพคเกจrglในอาร์วิธีการอื่นคือการใช้พล็อตตามเงื่อนไข coplotsสามารถช่วยในเรื่องความสัมพันธ์ระหว่างตัวแปร 3 หรือ 4 ตัวพร้อมกัน วิธีที่มีประโยชน์โดยเฉพาะอย่างยิ่งคือการใช้เมทริกซ์การกระจายเชิงโต้ตอบ(แม้ว่าจะต้องใช้ความพยายามมากขึ้นในการเรียนรู้) เช่นโดย 'การแปรง' การแปรงช่วยให้คุณสามารถเน้นจุดหรือจุดในเฟรมหนึ่งของเมทริกซ์และจุดเหล่านั้นจะถูกเน้นพร้อมกันในเฟรมอื่นทั้งหมด เมื่อเลื่อนแปรงไปรอบ ๆ คุณจะเห็นว่าตัวแปรทั้งหมดเปลี่ยนแปลงกันอย่างไร UPDATE: ความเป็นไปได้ว่าผมได้ลืมที่จะกล่าวถึงก็คือการใช้พล็อตพิกัดขนาน สิ่งนี้มีข้อเสียในการไม่ทำให้ตัวแปรตอบสนองของคุณแตกต่างกัน แต่อาจมีประโยชน์ตัวอย่างเช่นในการตรวจสอบความสัมพันธ์ระหว่างตัวแปร X ของคุณ
ฉันยังอยากจะชมเชยคุณสำหรับการตรวจสอบข้อมูลของคุณเรียงตามวันที่รวบรวม แม้ว่าข้อมูลจะถูกรวบรวมตลอดเวลา แต่ผู้คนก็ไม่ทำเช่นนี้เสมอไป พล็อตกราฟเส้นเป็นสิ่งที่ดี แต่ผมขอแนะนำให้คุณเสริมว่าด้วยกราฟของautocorrelationsและautocorrelations บางส่วน ใน R ฟังก์ชั่นสำหรับสิ่งเหล่านี้acf
และpacf
ตามลำดับ
ฉันรู้ว่าทั้งหมดนี้ไม่ได้ตอบคำถามของคุณในแง่ที่ให้เครื่องมือที่จะทำการแปลงทั้งหมดให้คุณโดยอัตโนมัติ แต่สิ่งหนึ่งที่บ่งบอกว่าคุณไม่ต้องทำหลาย ๆ แปลงตามที่คุณกลัว ตัวอย่างเช่น scatterplot matrix เป็นโค้ดหนึ่งบรรทัด นอกจากนี้ใน R, มันควรจะเป็นไปได้ที่จะเขียนฟังก์ชัน / บางรหัสนำมาใช้ใหม่สำหรับตัวเองที่จะเป็นบางส่วนโดยอัตโนมัติบางนี้ (เช่นฉันสามารถจินตนาการฟังก์ชั่นที่ใช้ในรายการของตัวแปรและวันที่สั่งซื้อได้, ประเภทพวกเขา เปิดหน้าต่างใหม่สำหรับแต่ละรายการที่มีบรรทัด, acf และ pacf)