วิเคราะห์สัดส่วน


13

ฉันมีชุดข้อมูลที่มีหลายสัดส่วนที่รวมกันเป็น 1 ฉันสนใจที่จะเปลี่ยนสัดส่วนเหล่านี้ตามการไล่ระดับสี (ดูตัวอย่างด้านล่างสำหรับข้อมูลตัวอย่าง)

gradient <- 1:99
A1 <- gradient * 0.005
A2 <- gradient * 0.004
A3 <- 1 - (A1 + A2)

df <- data.frame(gradient = gradient,
                 A1 = A1,
                 A2 = A2,
                 A3 = A3)

require(ggplot2)
require(reshape2)
dfm <- melt(df, id = "gradient")
ggplot(dfm, aes(x = gradient, y = value, fill = variable)) +
  geom_area()

ป้อนคำอธิบายรูปภาพที่นี่

ข้อมูลเพิ่มเติม: มันไม่จำเป็นต้องเป็นเส้นตรงฉันทำเพื่อความง่ายของตัวอย่าง จำนวนต้นฉบับที่คำนวณสัดส่วนเหล่านี้ยังมีอยู่ ชุดข้อมูลจริงมีตัวแปรเพิ่มขึ้นมากถึง 1 (เช่น B1, B2 & B3, C1 ถึง C4 ฯลฯ ) - ดังนั้นคำแนะนำสำหรับการแก้ปัญหาหลายตัวแปรก็มีประโยชน์เช่นกัน ... แต่สำหรับตอนนี้ฉันจะติดอยู่ที่ univariate ด้านของสถิติ

คำถาม: เราจะวิเคราะห์ข้อมูลประเภทนี้ได้อย่างไร? ฉันได้อ่านนิด ๆ หน่อย ๆ และบางทีแบบจำลองแบบมัลติโนเมียลหรือ glm เหมาะ? - หากฉันรัน glms 3 (หรือ 2) ฉันจะรวมข้อ จำกัด ที่ค่าที่คาดการณ์รวมไว้ที่ 1 ได้อย่างไร ฉันไม่ต้องการพล็อตข้อมูลประเภทนี้เพียงอย่างเดียวฉันยังต้องการถดถอยอย่างลึกล้ำเช่นการวิเคราะห์ ฉันต้องการใช้ R - ฉันจะทำสิ่งนี้ใน R ได้อย่างไร


คำสั่งproprcsplineใน Stata อาจเป็นสิ่งที่คุณกำลังมองหา (ฉันรู้ว่าคุณต้องการใช้Rแต่อาจเป็นจุดเริ่มต้น): proprcspline คำนวณลูกบาศก์ spline ที่ จำกัด ตามสัดส่วนของการสังเกตในแต่ละประเภทของ yvar ที่ได้รับ xvar และ กราฟพวกเขาเป็นพล็อตพื้นที่ซ้อนกัน ทางเลือกสัดส่วนที่ราบรื่นเหล่านี้สามารถปรับได้สำหรับชุดของตัวแปรควบคุม (cvars)
boscovich

คุณช่วยอธิบายสิ่งที่ "สนใจใน" ได้ไหม? คุณเพียงแค่ต้องการพล็อตสัดส่วนกับการไล่ระดับสี หรือคุณมีการวิเคราะห์เชิงลึกในใจ? ถ้าเป็นเช่นนั้นอะไรคือลักษณะของมัน - คุณต้องการเรียนรู้อะไรจากข้อมูลเหล่านี้อย่างแม่นยำ? นอกจากนี้คุณมีจำนวนจริง (ซึ่งจะดี) หรือเพียงสัดส่วน? คุณช่วยเล่าเพิ่มเติมเกี่ยวกับข้อมูลเหล่านี้ได้อย่างไรและรวบรวมอย่างไร
whuber

1
@whuber: ฉันต้องการทำการวิเคราะห์เชิงลึกกับข้อมูลนี้ สมมติฐานของฉันคือสัดส่วนจะเปลี่ยนไปตามความชัน นอกจากนี้ยังมีการนับ
EDi

1
ดูเหมือนว่าคุณมีข้อมูลองค์ประกอบ ฉันไม่รู้อะไรมากมายเกี่ยวกับเรื่องนี้ แต่งานของ Aitchison เป็นจุดเริ่มต้น มีแพ็คเกจ, องค์ประกอบ, ใน CRAN
Aaron ออกจาก Stack Overflow

คำตอบ:


13

ในมิติเดียวดูเหมือนว่างานสำหรับการถดถอยเบต้า (มีหรือไม่มีการกระจายตัวแปร) นี่คือรูปแบบการถดถอยที่มีตัวแปรขึ้นอยู่กับการกระจายเบต้าซึ่งมีข้อ จำกัด ตามธรรมชาติ 0-1 แพคเกจ R คือbetaregและกระดาษอธิบายการใช้งานเป็นที่นี่
สำหรับมากกว่าสองสัดส่วนส่วนขยายปกติของการแจกแจงแบบเบต้าจะนำไปสู่การถดถอยแบบไดริชเล็ต แพคเกจ R DirichletRegใช้ได้อธิบายเช่นที่นี่

มีเหตุผลบางอย่างที่จะไม่ใช้ลิงก์ logit และการถดถอยโลจิสติกพหุนามสำหรับข้อมูลประกอบจริงส่วนใหญ่จะทำอย่างไรกับสมมติฐานที่แข็งแกร่งที่พวกเขาบ่งบอกถึงความแปรปรวน อย่างไรก็ตามหากข้อมูลของคุณเป็นจำนวนจริงทั้งหมด (มากมาย?) สมมติฐานเหล่านั้นอาจถูกต้องและข้อเสนอแนะของปีเตอร์อาจเป็นวิธีที่จะไป


ขอบคุณสำหรับลิงค์ฉันจะได้ดูพวกเขา DirichletReg ดูมีแนวโน้ม! ตัวอย่างเช่นสไลด์ 3 ของลิงก์ของคุณ: "ถ้า 'ความน่าจะเป็น' ในการตอบคำถามในบางหมวดหมู่ถูกกระจายไปทั่วตัวเลือกแนวทาง Dirichlet จะให้ข้อมูลมากกว่านี้" . เพราะฉันไม่รู้ว่าจะทำอย่างไรกับ mlogit เพราะตัวเลือกไม่จำเป็นต้องไม่ซ้ำกัน นอกจากนี้ยังเป็นวิธีที่ดีในการนำเสนอกราฟิก - ไม่ได้คิดเกี่ยวกับเรื่องนั้น ...
EDi

สำหรับกราฟิกคุณอาจพบว่าฟังก์ชัน R splineplotและcdplot มีประโยชน์ อันที่จริงถ้าคุณเพียงแค่ต้องการให้เส้นติดตั้งและไม่จำเป็นต้องมากของเครื่องจักรถดถอยแล้วคุณอาจจะได้โคแอกเชียcdplotเข้าไปให้คุณเส้นโค้งที่เกี่ยวข้อง (มันเป็นเพียงความหนาแน่นใต้)
conjugateprior

ขออภัยฉันหมายถึงพิมพ์spineplotด้านบนอย่างชัดเจน
conjugateprior

โปรดทราบว่าแพ็คเกจ DirichletReg มีให้บริการบน CRANแล้วและบทความสั้น ๆได้รับการเผยแพร่แล้ว
jbaums

4

ฉันไม่แน่ใจว่าสิ่งที่คุณกำลังพยายามหา แต่สิ่งที่เกี่ยวกับการถดถอยโลจิสติก multinomial กับการไล่ระดับสีเป็นตัวแปรอิสระ?

ใน R วิธีหนึ่งในการทำเช่นนี้คือฟังก์ชัน mlogit ในไลบรารี mlogit ดูบทความสั้นนี้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.