คำถามติดแท็ก data-visualization

การสร้างข้อมูลกราฟิกที่เป็นประโยชน์และมีประโยชน์ (หากคำถามของคุณเกี่ยวกับวิธีการรับซอฟต์แวร์เฉพาะเพื่อสร้างเอฟเฟกต์เฉพาะอาจเป็นไปได้ว่าไม่ใช่หัวข้อที่นี่)

3
ตัวเลือกยอดนิยมสำหรับการแสดงข้อมูล 4 มิติเป็นอย่างไร
สมมติว่าฉันมีข้อมูลสี่มิติต่อไปนี้ซึ่งสามอันดับแรกสามารถพิจารณาเป็นพิกัดได้และข้อมูลสุดท้ายถือเป็นค่าได้ c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95 ทำอย่างไรถึงจะเห็นภาพผลกระทบของสามพิกัดแรกที่ดีกว่าในค่าสุดท้ายได้อย่างไร ฉันตระหนักถึงสามวิธี หนึ่งคือพล็อต 3 มิติสำหรับสามพิกัดแรกที่มีขนาดของคะแนนเป็นค่าสี่ค่า แต่มันไม่ง่ายที่จะเห็นแนวโน้มในข้อมูล อีกอันหนึ่งคือการใช้ชุดข้อมูลพล็อต 3 มิติซึ่งแต่ละรายการมีการแก้ไขพิกัด อีกอันหนึ่งอาจจะเป็น "กราฟโครงสร้างบังตาที่เป็นช่อง" ในตาข่ายของ R. ไม่ใช่ sur eif สำหรับวัตถุประสงค์นี้ แต่ดูเหมือนเป็นเช่นนั้น

3
ฉันจะตีความพล็อตเปอร์เซ็นต์การตัดแต่งเทียบกับค่าเฉลี่ยที่ถูกตัดได้อย่างไร
สำหรับคำถามการบ้านฉันถูกขอให้คำนวณค่าเฉลี่ยที่ถูกตัดสำหรับชุดข้อมูลโดยการลบการสังเกตที่เล็กที่สุดและใหญ่ที่สุดและตีความผลลัพธ์ ค่าเฉลี่ยที่ถูกตัดนั้นต่ำกว่าค่าเฉลี่ยที่ไม่ได้รับการตัดต่อ การตีความของฉันคือว่านี่เป็นเพราะการแจกแจงพื้นฐานนั้นเบ้ในทางบวกดังนั้นหางซ้ายจึงทึบกว่าหางขวา ผลที่ตามมาจากความเบ้นี้การลบตัวเลขที่สูงจะลากค่าเฉลี่ยลงมากกว่าการลบค่าต่ำที่ผลักมันขึ้นเพราะการพูดอย่างไม่เป็นทางการมีข้อมูลต่ำมาก "รอให้เกิดขึ้น" (มันสมเหตุสมผลหรือไม่) จากนั้นฉันก็เริ่มสงสัยว่าเปอร์เซ็นต์การตัดแต่งมีผลต่อสิ่งนี้อย่างไรดังนั้นฉันคำนวณค่าเฉลี่ยที่ถูกตัดสำหรับต่าง ๆ n ฉันมีรูปโค้งที่น่าสนใจ: x¯tr(k)x¯tr⁡(k)\bar x_{\operatorname{tr}(k)}k=1/n,2/n,…,(n2−1)/nk=1/n,2/n,…,(n2−1)/nk = 1/n, 2/n, \dotsc, (\frac{n}{2}-1)/n ฉันค่อนข้างไม่แน่ใจว่าจะตีความสิ่งนี้อย่างไร โดยสังหรณ์ใจดูเหมือนว่าความชันของกราฟควรเป็น (สัดส่วน) ความเบ้ลบของส่วนการกระจายภายในจุดข้อมูลของค่ามัธยฐาน (สมมติฐานนี้ตรวจสอบกับข้อมูลของฉัน แต่ฉันมีเพียงดังนั้นฉันไม่มั่นใจมาก)kkkn=11n=11n = 11 กราฟประเภทนี้มีชื่อหรือใช้กันทั่วไปหรือไม่ เราสามารถรวบรวมข้อมูลอะไรจากกราฟนี้ มีการตีความมาตรฐานหรือไม่? สำหรับการอ้างอิงข้อมูลคือ: 4, 5, 5, 6, 11, 17, 18, 23, 33, 35, 80

2
เป็นเรื่องผิดหรือไม่ที่จะใช้พล็อตสายสำหรับข้อมูลที่ไม่ต่อเนื่อง?
ฉันมักจะเห็นชุดข้อมูลที่แยกออกมาเป็นพล็อตบรรทัด แต่มันเกิดขึ้นกับฉันที่บรรทัด infers ค่าที่จุดระหว่างช่วงการวัดที่ไม่มีความหมายสำหรับชุดข้อมูลที่ไม่ต่อเนื่อง ดังนั้นจึงเป็นกรณีการใช้เส้นแปลงสำหรับข้อมูลที่ไม่ต่อเนื่องผิดหรือไม่? ยกตัวอย่างเช่นใช้ชุดข้อมูลอนุกรมสองชุดหนึ่งชุดต่อเนื่อง (น้ำหนักของฉันวัดทุกวันในตอนเช้า) และหนึ่งชุดแยกกัน (จำนวนโดนัทที่ฉันกินต่อวัน) มันสมเหตุสมผลสำหรับชุดข้อมูลแรกที่เป็นพล็อตบรรทัดเนื่องจากมีความสมเหตุสมผลที่จะสรุปว่าน้ำหนักของฉันในช่วงบ่ายใด ๆ นั้นจะเกี่ยวข้องกับน้ำหนักของฉันในตอนเช้าก่อนหน้าและต่อไปนี้ อย่างไรก็ตามหากจำนวนโดนัทถูกแสดงเป็นกราฟเส้นบรรทัดระหว่างจุดจะไม่สามารถอนุมานความหมายจากบรรทัดนั้นได้ แก้ไข นี่คืออีกตัวอย่าง: ค่าแรงขั้นต่ำของรัฐบาลกลางทุกชั่วโมงตั้งแต่พล็อตการลงทะเบียนเรียนที่http://mste.illinois.edu/courses/ci330ms/youtsey/lineinfo.html การเปลี่ยนแปลงค่าแรงขั้นต่ำนั้นไม่ต่อเนื่องดังนั้นฉันจึงไม่สามารถค้นหาเวลาที่เลือกโดยพลการและกำหนดค่าแรงขั้นต่ำ ณ จุดโดยใช้บรรทัดที่เชื่อมต่อจุดต่าง ๆ

2
พล็อต QQ ไม่ตรงกับฮิสโตแกรม
ฉันมีฮิสโตแกรมความหนาแน่นของเคอร์เนลและการกระจายผลตอบแทนทางการเงินแบบปกติที่ติดตั้งไว้ซึ่งเปลี่ยนเป็นความสูญเสีย (สัญญาณเปลี่ยน) และพล็อต QQ ปกติของข้อมูลเหล่านี้: พล็อต QQ แสดงให้เห็นชัดเจนว่าก้อยไม่ได้ติดตั้งอย่างถูกต้อง แต่ถ้าฉันดูฮิสโตแกรมและการกระจายแบบปกติที่ติดตั้ง (สีฟ้า) แม้ค่ารอบ 0.0 จะไม่ถูกต้อง ดังนั้นพล็อต QQ แสดงให้เห็นว่ามีเพียงหางที่ไม่เหมาะสม แต่เห็นได้ชัดว่าการกระจายทั้งหมดไม่ได้ติดตั้งอย่างถูกต้อง ทำไมสิ่งนี้ถึงไม่ปรากฏในพล็อต QQ?

1
วิธีคำนวณ“ เส้นทางสู่ทำเนียบขาว” โดยใช้ R
ฉันเพิ่งเจอการวิเคราะห์ที่ยอดเยี่ยมนี้ซึ่งทั้งน่าสนใจและสวยงามด้วยสายตา: http://www.nytimes.com/interactive/2012/11/02/us/politics/paths-to-the-white-house.html ฉันอยากรู้ว่า "เส้นทางต้นไม้" นั้นสามารถสร้างได้อย่างไรโดยใช้ R ข้อมูลและอัลกอริทึมใดที่เราจำเป็นต้องสร้างเช่นเส้นทางต้นไม้ ขอบคุณ

1
การสร้างกราฟเส้นโค้งความน่าจะเป็นสำหรับโมเดล Logit พร้อมตัวทำนายหลายตัว
ฉันมีฟังก์ชั่นความน่าจะเป็นดังต่อไปนี้: Prob=11+e−zProb=11+e−z\text{Prob} = \frac{1}{1 + e^{-z}} ที่ไหน z=B0+B1X1+⋯+BnXn.z=B0+B1X1+⋯+BnXn.z = B_0 + B_1X_1 + \dots + B_nX_n. แบบจำลองของฉันดูเหมือน Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)])Pr(Y=1)=11+exp⁡(−[−3.92+0.014×(bid)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid})]\right)} สิ่งนี้ถูกมองเห็นผ่านเส้นโค้งความน่าจะเป็นซึ่งดูเหมือนกับด้านล่าง ฉันกำลังพิจารณาเพิ่มตัวแปรสองตัวในสมการการถดถอยเดิมของฉัน สมมติว่าฉันเพิ่มเพศ (หมวดหมู่: F และ M) และอายุ (หมวดหมู่: <25 และ> 26) ลงในโมเดลฉันท้ายด้วย: Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)+0.25×(gender)+0.15×(age)])Pr(Y=1)=11+exp⁡(−[−3.92+0.014×(bid)+0.25×(gender)+0.15×(age)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid}) + 0.25\times(\text{gender}) + 0.15\times(\text{age})]\right)} ใน RI …

1
ความแตกต่างระหว่าง PROC Mixed และ lme / lmer ใน R - degree of freedom
หมายเหตุ: คำถามนี้เป็นคำถามใหม่เนื่องจากต้องลบคำถามก่อนหน้านี้ด้วยเหตุผลทางกฎหมาย ในขณะที่เปรียบเทียบ PROC MIXED จาก SAS กับฟังก์ชันlmeจากnlmeแพ็คเกจใน R ฉันพบความแตกต่างที่ค่อนข้างสับสน โดยเฉพาะอย่างยิ่งองศาอิสระในการทดสอบที่แตกต่างกันระหว่างPROC MIXEDและlmeและฉันสงสัยว่าทำไม เริ่มจากชุดข้อมูลต่อไปนี้ (รหัส R ระบุด้านล่าง): ind: ปัจจัยบ่งชี้บุคคลที่จะทำการวัด fac: อวัยวะที่ใช้ทำการวัด trt: ปัจจัยบ่งชี้การรักษา y: ตัวแปรตอบสนองต่อเนื่องบางอย่าง ความคิดคือการสร้างแบบจำลองง่ายๆดังต่อไปนี้: y ~ trt + (ind): indเป็นปัจจัยสุ่ม y ~ trt + (fac(ind)): facซ้อนกันindเป็นปัจจัยสุ่ม โปรดทราบว่ารุ่นสุดท้ายที่ควรทำให้เกิดเอกเป็นมีเพียง 1 ค่าของyสำหรับการรวมกันของทุกและindfac แบบจำลองแรก ใน SAS ฉันสร้างโมเดลต่อไปนี้: PROC MIXED data=Data; CLASS ind fac …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
Logistic quantile regression - วิธีการถ่ายทอดผลลัพธ์
ในโพสต์ก่อนหน้านี้ฉันสงสัยว่าจะจัดการกับคะแนน EQ-5D ได้อย่างไร เมื่อเร็ว ๆ นี้ฉันได้พบกับการถดถอยเชิงปริมาณของโลจิสติกส์ที่Bottai และ McKeownแนะนำซึ่งนำเสนอวิธีการที่ยอดเยี่ยมในการจัดการกับผลลัพธ์ที่ถูกผูกไว้ สูตรง่าย: l o gฉันt ( y) = l o g( y- ym ฉันnYm a x- y)logit(y)=log(y−yminymax−y)logit(y)=log(\frac{y-y_{min}}{y_{max}-y}) เพื่อหลีกเลี่ยงการเข้าสู่ระบบ (0) และการหารด้วย 0 คุณขยายช่วงโดยมีค่าขนาดเล็กεสิ่งนี้ทำให้สภาพแวดล้อมที่เคารพขอบเขตของคะแนนεϵ\epsilon ปัญหาคือว่าใด ๆจะอยู่ในขนาด logit และที่ไม่ได้ทำให้รู้สึกใด ๆ เว้นแต่เปลี่ยนกลับเข้าสู่ระดับปกติ แต่นั่นหมายความว่าβจะไม่เชิงเส้น สำหรับจุดประสงค์ในการสร้างกราฟสิ่งนี้ไม่สำคัญ แต่ไม่ได้มีมากกว่าβ : s สิ่งนี้จะไม่สะดวกมากββ\betaββ\betaββ\beta คำถามของฉัน: คุณแนะนำให้รายงาน logit โดยไม่รายงานการขยายเต็มได้อย่างไรββ\beta ตัวอย่างการนำไปปฏิบัติ สำหรับการทดสอบการใช้งานฉันได้เขียนแบบจำลองโดยใช้ฟังก์ชั่นพื้นฐานนี้: outcome=β0+β1∗xtest3+β2∗sexoutcome=β0+β1∗xtest3+β2∗sexoutcome=\beta_0+\beta_1* xtest^3+\beta_2*sex β0=0β0=0\beta_0 …

9
ฉันจะสร้างกราฟที่ดีโดยอัตโนมัติได้อย่างไร
เช่น. เช่นที่อยู่ในหน้านี้http://store.steampowered.com/hwsurvey มีซอฟต์แวร์สำเร็จรูปที่สามารถทำสิ่งนี้ได้หรือไม่? อีกทางเลือกหนึ่งคำแนะนำสำหรับซอฟต์แวร์อื่นที่มีลักษณะคล้ายกัน ฉันรู้ว่านี่ไม่ใช่คำถามเชิงสถิติ แต่ฉันรู้สึกอย่างแรงกล้าว่าข้อมูลควรถูกนำเสนอในลักษณะที่เรียบร้อยและน่าดึงดูดใจเพื่อให้มีประสิทธิภาพดังนั้นฉันคิดว่าคำถามนี้น่าจะเป็นปัญหาสำหรับบางคน อัปเดต (29/12/11) : ขอบคุณสำหรับการตอบคำถามทั้งหมดนี้ฉันขอขอบคุณข้อเสนอแนะของคุณทั้งหมด โดยอัตโนมัติฉันหมายความว่าฉันป้อนข้อมูล & กราฟจะได้รับการอัปเดตโดยอัตโนมัติ วัตถุประสงค์ของโครงการของฉันคือการรวบรวมข้อมูล 6-10 ชุดต่อวัน (หรืออาจ 2x ทุกวัน) ในช่วงระยะเวลาที่ไม่ จำกัด และฉันต้องการค้นหาวิธีในการแสดงข้อมูลในเว็บไซต์ (คล้ายกับลิงก์ Steam ที่ฉัน ที่ระบุไว้ด้านบน) ในขณะที่แบ็กเอนด์ผู้ใช้นั้นง่ายพอสำหรับผู้ใช้ที่ไม่ใช่ด้านเทคนิค หากคุณมีข้อเสนอแนะเพิ่มเติมโปรดเพิ่มคำตอบ! ขอบคุณอีกครั้ง!

2
การวาดกราฟแท่งหลายอันบนกราฟใน R [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นไปตามหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน4 ปีที่แล้ว ฉันต้องการพล็อตกราฟแท่งสี่แท่งบนกราฟเดี่ยวในอาร์ฉันใช้รหัสต่อไปนี้ ในที่นี้จะรักษาตำนานไว้บนกราฟได้อย่างไรโดยเฉพาะตำนานควรอยู่ระหว่าง 2 และ 3 barplots ฉันลองด้วยpar(mar=c(4.1,4.1,8.1,4.1)แต่ก็ไม่ประสบความสำเร็จ ยิ่งไปกว่านั้นฉันยังพยายามวิ่งlegend()ตามบาร์ปล็อตที่สอง แต่ไม่มีประโยชน์ ตำนานสำหรับทั้งสี่ barplots โปรดช่วยฉันในเรื่องนี้ par(mfrow=c(1,4)) barplot(t(A), beside=T, ylim=c(-100,100),..) barplot(t(B), beside=T, ylim=c(-100,100),..) barplot(t(C), beside=T, ylim=c(-100,100),..) barplot(t(D), beside=T, ylim=c(-100,100),..) legend(...)

3
หนึ่งจะตีความพล็อต Bland-Altman ได้อย่างไร
ในภาษาอังกฤษธรรมดาหนึ่งคนตีความพล็อตเรื่อง Bland-Altman อย่างไร ข้อดีของการใช้พล็อต Bland-Altman เหนือวิธีอื่นในการเปรียบเทียบวิธีการวัดสองวิธีแตกต่างกันอย่างไร

2
มัน“ โอเค” ที่จะลงจุดเส้นถดถอยสำหรับข้อมูลอันดับ (Spearman correlation) หรือไม่?
ฉันมีข้อมูลที่ฉันคำนวณความสัมพันธ์ Spearman และต้องการเห็นภาพสำหรับสิ่งพิมพ์ ตัวแปรที่ขึ้นอยู่กับการจัดอันดับตัวแปรอิสระไม่ได้ สิ่งที่ฉันต้องการเห็นภาพนั้นเป็นแนวโน้มทั่วไปมากกว่าความชันจริงดังนั้นฉันจึงจัดอันดับความเป็นอิสระและใช้ความสัมพันธ์ / การถดถอยของสเปียร์แมน แต่เมื่อฉันวางแผนข้อมูลของฉันและกำลังจะแทรกลงในต้นฉบับของฉันฉันสะดุดกับคำสั่งนี้ (บนเว็บไซต์นี้ ): คุณจะแทบไม่เคยใช้เส้นถดถอยสำหรับคำอธิบายหรือทำนายอย่างใดอย่างหนึ่งเมื่อคุณทำสเปียร์แมนยศสัมพันธ์ดังนั้นไม่คำนวณเทียบเท่าของสายการถดถอย และหลังจากนั้น คุณสามารถสร้างกราฟข้อมูลความสัมพันธ์อันดับ Spearman ในลักษณะเดียวกับการถดถอยเชิงเส้นหรือสหสัมพันธ์ อย่าใส่เส้นถดถอยบนกราฟอย่างไรก็ตาม; มันจะทำให้เข้าใจผิดที่จะวางเส้นถดถอยเชิงเส้นบนกราฟเมื่อคุณวิเคราะห์ด้วยความสัมพันธ์อันดับ ประเด็นก็คือเส้นการถดถอยนั้นไม่แตกต่างจากตอนที่ฉันไม่ได้จัดอันดับความเป็นอิสระและคำนวณสหสัมพันธ์ของเพียร์สัน แนวโน้มเหมือนกัน แต่เนื่องจากค่าธรรมเนียมที่สูงเกินไปสำหรับกราฟิกสีในสมุดรายวันที่ฉันไปด้วยการแสดงเอกรงค์และจุดข้อมูลที่แท้จริงจะทับซ้อนกันมากจนไม่เป็นที่รู้จัก แน่นอนว่าฉันสามารถหลีกเลี่ยงปัญหานี้ได้ด้วยการทำแปลงสองแบบ: แบบหนึ่งสำหรับจุดข้อมูล (อันดับ) และอีกแบบสำหรับเส้นการถดถอย (ไม่จัดอันดับ) แต่ถ้าปรากฎว่าแหล่งข้อมูลที่ฉันอ้างนั้นผิดหรือปัญหา ไม่เป็นปัญหาในกรณีของฉันมันจะทำให้ชีวิตของฉันง่ายขึ้น (ฉันเห็นคำถามนี้ด้วย แต่ก็ไม่ได้ช่วยฉัน) แก้ไขสำหรับข้อมูลเพิ่มเติม: ตัวแปรอิสระบนแกน x แสดงถึงจำนวนของคุณสมบัติและตัวแปรที่ขึ้นต่อกันบนแกน y แสดงถึงอันดับหากอัลกอริทึมการจำแนกประเภทเมื่อเปรียบเทียบกับประสิทธิภาพของพวกเขา ตอนนี้ฉันมีอัลกอริธึมที่เทียบเคียงได้โดยเฉลี่ย แต่สิ่งที่ฉันอยากจะพูดกับพล็อตของฉันก็คือ: "ในขณะที่ตัวแยกประเภท A ได้รับฟีเจอร์ที่ดีกว่ายิ่งมีฟีเจอร์ตัวแยกประเภท B จะดีกว่า แก้ไข 2 เพื่อรวมแปลงของฉัน: อันดับของอัลกอริทึมถูกพล็อตเมื่อเทียบกับจำนวนฟีเจอร์ อันดับของอัลกอริทึมที่ถูกจับคู่กับจำนวนอันดับของฟีเจอร์ ดังนั้นเพื่อทำซ้ำคำถามจากชื่อ: การลงจุดเส้นถดถอยสำหรับข้อมูลอันดับของ Spearman …

2
การตีความพล็อต QQ
พิจารณารหัสและผลลัพธ์ต่อไปนี้: par(mfrow=c(3,2)) # generate random data from weibull distribution x = rweibull(20, 8, 2) # Quantile-Quantile Plot for different distributions qqPlot(x, "log-normal") qqPlot(x, "normal") qqPlot(x, "exponential", DB = TRUE) qqPlot(x, "cauchy") qqPlot(x, "weibull") qqPlot(x, "logistic") ดูเหมือนว่าพล็อต QQ สำหรับบันทึกปกติเกือบจะเหมือนกับพล็อต QQ สำหรับ weibull เราจะแยกแยะพวกมันได้อย่างไร นอกจากนี้หากคะแนนอยู่ในพื้นที่ที่กำหนดโดยเส้นสีดำด้านนอกสองเส้นนั่นแสดงว่ามันเป็นไปตามการแจกแจงที่ระบุหรือไม่?

5
วิธีที่จะทำให้ระดับความเข้มของสีที่ดี?
ฉันไม่ใช่สถิติที่ดี แต่ฉันคิดว่าฉันมาถูกที่แล้ว คำถามของฉันง่าย: ปัญหาของฉันประกอบด้วยการเปรียบเทียบประชากรของหลายรัฐในประเทศเล็ก ๆ แต่บางรัฐมีประชากร 3,000,000 คนและประชากร 2,000 คน ฉันวาดมันลงบนแผนที่และ "ความเข้ม" ของสีขึ้นอยู่กับว่าประชากรของทุกรัฐเปรียบเทียบกับประชากรของทั้งประเทศอย่างไร ปัญหาคือว่ารัฐที่มีประชากรจำนวนมากจะแสดงด้วยสีที่รุนแรงจริงๆและรัฐขนาดเล็กแทบจะไม่มีสีใด ๆ มีวิธีง่าย ๆ ในการ "ทำให้ปกติ" หรือทำให้ข้อมูลเปรียบเทียบได้หรือไม่? ฉันไม่รู้ว่าฉันอธิบายตัวเองถูกต้องหรือไม่ แต่ฉันหวังว่าบางคนสามารถช่วยฉันได้ โปรดแสดงความคิดเห็นหากคำถามของฉันไม่ชัดเจนและฉันจะชี้แจง ขอขอบคุณสำหรับความช่วยเหลือของคุณ!

1
การใช้ t-SNE ดีอย่างไรนอกเหนือจากการสร้างภาพข้อมูล?
เราควรใช้ t-SNE ในสถานการณ์ใด (นอกเหนือจากการสร้างภาพข้อมูล) T-SNE ใช้สำหรับลดมิติข้อมูล คำตอบสำหรับคำถามนี้ ชี้ให้เห็นว่าควรใช้ t-SNE สำหรับการสร้างภาพข้อมูลเท่านั้นและไม่ควรใช้สำหรับการทำคลัสเตอร์ ถ้าอย่างนั้นการใช้ t-SNE ดีอย่างไร?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.