คำถามติดแท็ก software

ตรวจสอบให้แน่ใจว่าคำถามของคุณเกี่ยวข้องกับสถิติการเรียนรู้ของเครื่องหรือการวิเคราะห์ข้อมูลและไม่เพียง แต่เกี่ยวกับการเขียนโปรแกรมการสนับสนุนหรือข้อบกพร่องเท่านั้น รวมแท็กเพิ่มเติมที่อ้างอิงถึงปัญหาทางสถิติที่เกี่ยวข้อง

8
แนวคิดสำหรับซอฟต์แวร์“ แล็บบุ๊คโน้ตบุ๊ค” หรือไม่
นี่เป็นสิ่งที่แปลก แต่จริง ๆ แล้วฉันคิดว่ามันเป็นสิ่งที่แปลกสำหรับเว็บไซต์ใด ๆ ดังนั้นฉันคิดว่าฉันจะลองที่นี่ในบรรดาพี่น้องของฉัน ฉันมาที่ระบาดวิทยาและชีวสถิติจากชีววิทยาและยังคงมีนิสัยบางอย่างจากสาขานั้น หนึ่งในนั้นคือการรักษาสมุดบันทึกในห้องปฏิบัติการ มันมีประโยชน์สำหรับการบันทึกความคิดการตัดสินใจดนตรีเกี่ยวกับการวิเคราะห์ ฯลฯ ในที่เดียวทุกอย่างที่ทำไว้เพื่อให้ฉันสามารถมองย้อนกลับไปในการวิเคราะห์ในภายหลังและมีเงื่อนงำสิ่งที่ฉันทำ แต่มันจะเป็นการดีที่จะย้ายเข้าไปในศตวรรษที่ 21 โดยเฉพาะอย่างยิ่งเพราะแม้ว่าระบบโน้ตบุ๊กในห้องปฏิบัติการจะมีความเหมาะสมเพียงพอสำหรับการตัดสินใจของบุคคลหนึ่งคนและเอกสาร แต่ก็เป็นเรื่องดีที่สามารถแนบพล็อตจาก EDA อีเมลจากผู้จัดการข้อมูลที่พูดถึงชุดข้อมูลเฉพาะ ฯลฯ ฉันเดาว่าสิ่งนี้จะเกี่ยวข้องกับการเพิ่มระบบของฉันเองจากสหภาพที่ไม่บริสุทธิ์ของบิตที่แตกต่างกันหลายคน แต่ในปัจจุบันมีใครบ้างที่ใช้ระบบและมีคำแนะนำใด ๆ

14
ซอฟต์แวร์สำหรับการสำรวจข้อมูลที่เรียบง่าย แต่มีประสิทธิภาพ
ในความพยายามของฉันในการต่อสู้กับการทำร้ายร่างกายของสเปรดชีตฉันมักจะประกาศข่าวประเสริฐในการผลักดันเครื่องมือที่มีประสิทธิภาพมากขึ้นเช่นซอฟต์แวร์สถิติจริง (R, Stata และอื่น ๆ ) เมื่อเร็ว ๆ นี้ฉันถูกท้าทายในมุมมองนี้โดยคนที่ระบุว่าพวกเขาจะไม่เรียนรู้ที่จะทำรายการ ฉันต้องการมอบเครื่องมือวิเคราะห์ข้อมูลที่ไม่จำเป็นต้องมีการเขียนโปรแกรม (แต่เป็นการดีที่จะขยายการเขียนโปรแกรมหากพวกเขาตัดสินใจที่จะจุ่มนิ้วเท้าลงไปในน้ำในภายหลัง) มีแพ็คเกจอะไรบ้างสำหรับการสำรวจข้อมูลที่ฉันสามารถแนะนำได้อย่างตรงไปตรงมา?

3
การเรียนแบบกึ่งมีผู้เรียน, การเรียนแบบกระตือรือร้นและการเรียนรู้ลึกเพื่อการจำแนกประเภท
การแก้ไขครั้งสุดท้ายพร้อมการอัปเดตทรัพยากรทั้งหมด: สำหรับโครงการฉันกำลังใช้อัลกอริธึมการเรียนรู้ของเครื่องเพื่อจัดหมวดหมู่ ถาม:ข้อมูลที่มีป้ายกำกับค่อนข้าง จำกัด และข้อมูลที่ไม่มีป้ายกำกับอีกมากมาย เป้าหมาย: ใช้การจำแนกประเภทภายใต้การดูแล ใช้กระบวนการการติดฉลากแบบกึ่งกำกับอย่างใด (ที่รู้จักกันว่าการเรียนรู้ที่ใช้งานอยู่) ฉันได้พบข้อมูลจำนวนมากจากงานวิจัยเช่นการใช้ EM, Transductive SVM หรือ S3VM (Semi Supervised SVM) หรือใช้ LDA อย่างอื่นเป็นต้นแม้จะมีหนังสือไม่กี่เล่มในหัวข้อนี้ คำถาม: การใช้งานและแหล่งข้อมูลที่เป็นประโยชน์อยู่ที่ไหน? อัปเดตครั้งสุดท้าย (ขึ้นอยู่กับความช่วยเหลือที่จัดทำโดย mpiktas, bayer และ Dikran Marsupial) การเรียนรู้แบบกึ่งภายใต้การดูแล: TSVM: ในSVMligthและSVMlin EM Naive Bayes ใน Python EM ในโครงการ LinePipe การเรียนรู้ที่ใช้งานอยู่: Dualist : การใช้งานการเรียนรู้อย่างคล่องแคล่วด้วยซอร์สโค้ดในการจำแนกข้อความ หน้าเว็บนี้ให้ภาพรวมที่ยอดเยี่ยมของการเรียนรู้ที่กระตือรือร้น การประชุมเชิงปฏิบัติการการออกแบบการทดลอง: ที่นี่ การเรียนรู้ลึก: วิดีโอแนะนำที่นี่ …

3
คุณบางคนใช้สเปรดชีตของ Google เอกสารเพื่อดำเนินการและแบ่งปันผลงานทางสถิติของคุณกับผู้อื่นหรือไม่?
ฉันรู้ว่าพวกคุณส่วนใหญ่อาจรู้สึกว่า Google เอกสารยังคงเป็นเครื่องมือดั้งเดิม ไม่ใช่ Matlab หรือ R และไม่ใช่แม้แต่ Excel กระนั้นฉันก็รู้สึกงุนงงกับพลังของซอฟต์แวร์ที่ทำงานบนเว็บที่เพิ่งใช้ความสามารถในการทำงานของเบราว์เซอร์ Mike Lawrence ซึ่งทำงานอยู่ในฟอรัมนี้ได้แบ่งปันสเปรดชีตกับเราโดยใช้ Google เอกสารซึ่งทำสิ่งที่น่าสนใจ โดยส่วนตัวแล้วฉันได้จำลองกรอบการทดสอบสมมติฐานอย่างละเอียด (รวมถึงการทดสอบแบบพารามิเตอร์และแบบไม่อิงพารามิเตอร์) ที่ทำใน Excel ใน Google เอกสาร ฉันสนใจถ้ามีใครในพวกคุณลองใช้ Google เอกสารและผลักมันให้ถึงขีด จำกัด ในแอปพลิเคชันที่น่าสนใจ ฉันสนใจที่จะรับฟังข้อบกพร่องหรือข้อบกพร่องที่คุณพบใน Google เอกสารด้วย ฉันกำลังตั้งคำถามนี้ว่า "สำหรับวิกิชุมชน" แสดงว่าไม่มีคำตอบที่ดีที่สุดสำหรับเรื่องนี้ เป็นการสำรวจมากกว่าสิ่งใด

3
ซอฟต์แวร์สร้างภาพข้อมูลโอเพ่นซอร์สที่ดีที่สุดที่จะใช้กับ PowerPoint
ซอฟต์แวร์สร้างภาพข้อมูลโอเพ่นซอร์สที่ดีที่สุดคืออะไร? ฉันต้องการสิ่งต่อไปนี้: สามารถนำเข้าข้อมูลจาก Microsoft Excel (การนำเข้าข้อมูลจากฐานข้อมูล Oracle ก็ดีเช่นกัน แต่ไม่จำเป็น) ชาร์ตที่สร้างโดยซอฟต์แวร์สามารถส่งออกไปยัง Microsoft PowerPoint (คัดลอกและวางได้ดีกับฉัน) โอเพ่นซอร์ส & ใช้งานง่าย

1
ห้องสมุดการเพิ่มประสิทธิภาพของข้อ จำกัด สำหรับข้อ จำกัด ความเท่าเทียมกันและความไม่เท่าเทียมกัน
คำแนะนำใด ๆ สำหรับการเลือกไลบรารีการเพิ่มประสิทธิภาพที่ จำกัด เหมาะสำหรับฟังก์ชั่นการเพิ่มประสิทธิภาพของฉัน ฉันกำลังลดขนาด ai) ฟังก์ชันที่ไม่ใช่เชิงเส้นด้วยข้อ จำกัด เชิงเส้นตรงและความไม่เท่าเทียมกันและ ii) มีการไล่ระดับสีและ hessian ของฟังก์ชัน ถ้ามันจะช่วยให้การทำงานของผมที่ลดเป็นความแตกต่าง Kullback-Liebler constrOptim เกี่ยวข้องเฉพาะกับข้อ จำกัด ที่ไม่เท่าเทียมกัน Quadprogจัดการ quadratics ความน่าเชื่อถือไม่สนับสนุนข้อ จำกัด ดังนั้นความแตกต่างของ KL จึงไม่สอดคล้องกับโซลูชันเหล่านี้ มีวิธีแก้ปัญหาค่อนข้างน้อยในหน้าR Cran Task สำหรับการปรับให้เหมาะสม เอี่ยมสามารถทำการปรับให้เหมาะสมใน MATLAB โดยใช้ฟังก์ชั่นfmincon () ซึ่งดูเหมือนว่าจะใช้การตกแต่งภายในหรือจุดสะท้อนแสงที่น่าเชื่อถือ เป็นการดีที่มีห้องสมุดที่เหมาะสมกับปัญหาที่กำหนดไว้

5
ซอฟต์แวร์ (หรือ webapps) สำหรับการสอนสถิติเด็กหรือความน่าจะเป็น?
ฉันต้องการ (ในอนาคตอันไกล) เพื่อสอนสถิติแก่เด็ก ๆ สำหรับเรื่องนั้นฉันยินดีที่จะรู้เกี่ยวกับซอฟต์แวร์ (เห็นได้ชัดว่าฉันกำลังพุ่งเข้าหา FOSS) หรือ webapps ซึ่งมีประโยชน์ในการอธิบายความคิดทางสถิติ / ความน่าจะเป็นสำหรับเด็ก ๆ (หรือผู้ใหญ่สำหรับเรื่องนั้น) สิ่งนี้สามารถใช้ได้ทั้งโดยผู้สอนเด็ก ๆ หรือทั้งสองอย่าง รูปแบบที่แนะนำของคำตอบ: ชื่อซอฟต์แวร์สิ่งที่ช่วยสอนใครควรใช้ลิงค์


9
ซอฟต์แวร์สร้างภาพข้อมูลสำหรับการทำคลัสเตอร์
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ฉันต้องการรวมกลุ่ม ~ 22,000 คะแนน อัลกอริทึมการจัดกลุ่มจำนวนมากทำงานได้ดีขึ้นด้วยการเดาเริ่มต้นที่มีคุณภาพสูงขึ้น มีเครื่องมืออะไรบ้างที่สามารถให้ความคิดที่ดีเกี่ยวกับรูปทรงคร่าวๆของข้อมูล ฉันต้องการเลือกการวัดระยะทางของฉันเองดังนั้นโปรแกรมที่ฉันสามารถป้อนรายการระยะทางตามเข็มคู่เพื่อให้ใช้ได้ ฉันต้องการที่จะทำบางสิ่งบางอย่างเช่นไฮไลต์ภูมิภาคหรือคลัสเตอร์บนจอแสดงผลและรับรายการจุดข้อมูลที่อยู่ในพื้นที่นั้น ต้องการซอฟต์แวร์ฟรี แต่ฉันมี SAS และ MATLAB อยู่แล้ว

3
ทับทิมเป็นโต๊ะทำงานสถิติ
และนี่ก็เป็นคำถามที่เกี่ยวข้องอย่างมากกับงูหลามเป็นสถิติที่ปรับแต่งและExcel เป็นสถิติที่ปรับแต่ง ฉันรู้ว่ามีการอภิปรายอย่างมากเกี่ยวกับ Ruby กับ Python แต่นี่ไม่ใช่ประเด็นของคำถามนี้ ฉันคิดว่าทับทิมเร็วกว่าไพ ธ อนและการมีไวยากรณ์ที่เป็นธรรมชาติมาก ๆ อาจเป็นประโยชน์ต่อฉันในการเข้าใจสถิติและอาจเป็นทางเลือกที่ดีสำหรับ R (ซึ่งเป็นที่สนใจของฉันและถูกอ้างถึงในคำถามอื่น ๆ ของฉันที่นี่) ตัวอย่างเช่นหนึ่งในการบรรยายของ Google Tech ที่ฉันเคยเห็น (อ้างถึงคำถามที่เชื่อมโยงที่นี่ผู้สอนบ่นว่า R ช้าในขณะที่สร้างลูปสำหรับ) ด้วย Ruby ยังมี Rails อยู่ด้วยดังนั้นอาจมีความเป็นไปได้ที่จะนำทั้งสองอย่างมารวมกัน (Python มี Django แต่อีกครั้งฉันไม่เข้าใจ) ดังนั้นคำถามก็เหมือนกัน แต่สำหรับฉันใน Ruby: คุณสามารถแนะนำอะไรได้ถ้าฉันต้องการใช้ Ruby เป็น "สถิติ workbench" เพื่อแทนที่ R, SPSS, Python, Excelฯลฯ สิ่งที่ฉันจะได้รับและสูญเสียขึ้นอยู่กับประสบการณ์ของคุณ? โปรดทราบฉันกำลังพิจารณาคำถามนี้ตามคำถาม Python และ Excel …
13 r  python  software  ruby 

4
ซอฟต์แวร์ลบข้อมูลระบุตัวตน
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ มีใครรู้บ้างเกี่ยวกับซอฟต์แวร์ลบข้อมูลระบุตัวตนที่ดี? หรืออาจเป็นแพ็คเกจสำหรับ R ที่ทำให้ข้อมูลไม่ระบุตัวตน เห็นได้ชัดว่าไม่คาดหวังว่าจะมีการปกปิดตัวตนที่ไม่สามารถติดตามได้ - เพียงต้องการทำให้ยาก
13 software 

3
เปลี่ยนจากการใช้ซอฟต์แวร์ทางสถิติเพื่อทำความเข้าใจสมการทางคณิตศาสตร์หรือไม่
บริบท: ฉันเป็นนักศึกษาปริญญาเอกด้านจิตวิทยา เช่นเดียวกับนักศึกษาปริญญาเอกจิตวิทยาหลายคนฉันรู้วิธีการวิเคราะห์ทางสถิติต่าง ๆ โดยใช้ซอฟต์แวร์ทางสถิติจนถึงเทคนิคต่าง ๆ เช่น PCA การจำแนกต้นไม้และการวิเคราะห์กลุ่ม แต่ก็ไม่เป็นที่น่าพอใจเพราะแม้ว่าฉันสามารถอธิบายได้ว่าทำไมฉันถึงวิเคราะห์และตัวบ่งชี้ความหมายฉันไม่สามารถอธิบายได้ว่าเทคนิคทำงานอย่างไร ปัญหาที่แท้จริงคือซอฟต์แวร์ทางสถิติที่เข้าใจง่าย แต่มีข้อ จำกัด ในการเรียนรู้เทคนิคใหม่ในบทความนั้นฉันต้องเข้าใจวิธีการอ่านสมการทางคณิตศาสตร์ ในปัจจุบันฉันไม่สามารถคำนวณค่าลักษณะเฉพาะหรือค่า K สมการเป็นเหมือนภาษาต่างประเทศสำหรับฉัน คำถาม: มีคำแนะนำที่ครอบคลุมที่ช่วยในการทำความเข้าใจสมการในบทความวารสารหรือไม่? แก้ไข: ฉันคิดว่าคำถามนั้นจะอธิบายได้ด้วยตนเองมากกว่า: เหนือความซับซ้อนบางอย่างสัญกรณ์ทางสถิติกลายเป็นคำพูดพล่อยๆสำหรับฉัน; สมมติว่าฉันต้องการโค้ดฟังก์ชั่นของตัวเองใน R หรือ C ++ เพื่อทำความเข้าใจกับเทคนิค แต่มีสิ่งกีดขวาง ฉันไม่สามารถแปลงสมการเป็นโปรแกรม และจริง ๆ : ฉันไม่รู้สถานการณ์ในโรงเรียนปริญญาเอกของสหรัฐอเมริกา แต่ในเหมือง (ฝรั่งเศส) หลักสูตรเดียวที่ฉันสามารถติดตามได้คือการเคลื่อนไหวเกี่ยวกับครอกศตวรรษที่ 16 ...

5
ภาษาการเขียนโปรแกรมใดที่คุณแนะนำให้สร้างต้นแบบปัญหาการเรียนรู้ของเครื่อง?
กำลังทำงานใน Octave แต่เนื่องจากความคืบหน้าของเอกสารไม่ดีช้ามาก ภาษาใดที่ง่ายต่อการเรียนรู้และใช้งานและมีเอกสารที่ดีในการแก้ปัญหาการเรียนรู้ของเครื่อง? ฉันกำลังมองหาต้นแบบบนชุดข้อมูลขนาดเล็ก (ตัวอย่างหลายพันตัวอย่าง) ดังนั้นความเร็วจึงไม่สำคัญ แก้ไข: ฉันกำลังพัฒนาเครื่องมือแนะนำ ดังนั้นฉันสนใจที่จะใช้ Regularized Linear Regression, Neural Nets, SVN หรือ Collaborative Filtering

8
ซอฟต์แวร์สถิติใดที่เหมาะสำหรับการสอนหลักสูตรสถิติระดับปริญญาตรีเบื้องต้นทางสังคมศาสตร์
ฉันกำลังมองหาแพคเกจซอฟต์แวร์เชิงสถิติซึ่งฉันสามารถใช้ในหลักสูตรเบื้องต้นของสถิติสำหรับโปรแกรมการศึกษาด้านสังคมศาสตร์ นักเรียนไม่มีความรู้ด้านสถิติมาก่อนและไม่มีประสบการณ์ในการเขียนโปรแกรมภาษา เป้าหมายคือเพื่อแนะนำแนวคิดทางสถิติพื้นฐาน (เช่นความแปรปรวนผลรวมของกำลังสองค่า p-value ... และการถดถอยเชิงเส้นในที่สุด) และเพื่อให้พวกเขาสามารถทำการวิเคราะห์ขั้นพื้นฐานด้วยตนเองโดยใช้ชุดข้อมูลตัวอย่าง หลักสูตรควรเกี่ยวกับแนวคิดการเรียนรู้โดยการทำสถิติมากกว่าการท่องจำสูตร (แม้ว่าฉันคิดว่าสูตรมีความสำคัญ) ดังนั้นฉันกำลังมองหาทางเลือกอื่นสำหรับไวยากรณ์ปกติ (ตามปกติ R) หรือซอฟต์แวร์ชี้และคลิก (เป็น SPSS หรือ Rcmdr) ซอฟต์แวร์ควรเรียนรู้ได้ง่ายและควรมีส่วนต่อประสานกราฟิกกับผู้ใช้ที่เห็นภาพชุดข้อมูลและเสนอกราฟและตารางมาตรฐาน สิ่งที่ดีที่สุดคือถ้ามันแสดงให้เห็นถึงขั้นตอนต่าง ๆ ของการวิเคราะห์ (เช่นการอ่านและการจัดการข้อมูลการคำนวณมาตรการเชิงพรรณนาการสร้างตารางและกราฟเชิงพรรณนาการคำนวณการวัดเชิงอนุมานการพล็อตกราฟเชิงอนุมานส่งออกไปยังรายงาน) คุณมีข้อเสนอแนะเกี่ยวกับซอฟต์แวร์ทางสถิติ (โอเพนซอร์ซหรือฟรี) ซึ่งเหมาะสำหรับการเรียนรู้และฝึกหัดทางสถิติเป็นอันดับแรก แก้ไข ขอบคุณสำหรับคำแนะนำของคุณ ฉันค้นหาgretlและโปรแกรมอื่นอีกสองโปรแกรมที่ฉันพบระหว่างการสอบถามออนไลน์ของฉัน: RapidMinerและห้องปฏิบัติการทางสถิติ [1] ฉันพบว่าgretlส่วนต่อประสานและเอาต์พุตมีความชัดเจนและมุ่งเน้นมากกว่า Rcmdr, SPSS หรือ Stata ดังนั้นจึงเป็นเครื่องมือที่เหมาะสมสำหรับการเริ่มสอนสถิติจากมุมมองของฉัน อย่างไรก็ตามผังงาน GUI ของRapidMinerและStatistical Labทำให้ฉันประทับใจเมื่อพวกเขาเห็นภาพขั้นตอนเดียวของการวิเคราะห์ทางสถิติ (เริ่มต้นด้วยการโหลดข้อมูล) ฉันคิดว่านี่อาจเป็นประโยชน์กับนักเรียนหลายคนที่ต่อสู้กับการเน้นคำอธิบายทางคณิตศาสตร์ตามปกติ แน่นอนว่า RapidMiner ดูเหมือนว่าฉันจะมีฟังก์ชั่นเมนูและปุ่มมากเกินไปสำหรับผู้เริ่มต้นในขณะที่แล็บทางสถิติจะเน้นมากขึ้น ข้อดีที่สำคัญของห้องทดลองทางสถิติคือ "R-Calculator" ที่มีลักษณะคล้ายคอนโซลพร้อมกับ "R-code …

1
ความแตกต่าง R และ EViews ในการประมาณการ AR (1)
ปัญหาหลักคือ: ฉันไม่สามารถรับค่าประมาณพารามิเตอร์ที่คล้ายกันกับ EViews และ R ด้วยเหตุผลที่ฉันไม่รู้จักตัวเองฉันจำเป็นต้องประเมินพารามิเตอร์สำหรับข้อมูลบางอย่างโดยใช้ตัวแสดงตัวอย่าง สิ่งนี้ทำได้โดยการเลือกตัวเลือก NLS (ไม่เชิงเส้นกำลังสองน้อยที่สุด) และใช้สูตรต่อไปนี้:indep_var c dep_var ar(1) EViews อ้างว่าพวกเขาประมาณกระบวนการเชิงเส้น AR (1) เช่น: โดยที่ข้อผิดพลาดถูกนิยามเป็น: โดยใช้สิ่งที่เทียบเท่า สมการ (ด้วยการแทนที่พีชคณิตบางส่วน): นอกจากนี้เธรดนี้ ที่ฟอรัม EViewsแนะนำว่าการประมาณค่า NLS ของพวกเขาถูกสร้างขึ้นโดยอัลกอริทึม Marquardtยูทียูที = ρ ⋅ ยูที- 1 + ε Y T = ( 1 - ρ ) α + ρ Y T - 1 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.