คำถามติดแท็ก statistics

พิจารณาว่าจะถามคำถามของคุณได้ดีกว่าหรือไม่ที่ https://stats.stackexchange.com สถิติคือการศึกษาทางคณิตศาสตร์โดยใช้ความน่าจะเป็นในการสรุปลักษณะของประชากรจากกลุ่มตัวอย่างหรือการสังเกตจำนวน จำกัด

15
Cosmic Rays: ความน่าจะเป็นที่พวกเขาจะมีผลต่อโปรแกรมคืออะไร?
อีกครั้งที่ฉันอยู่ในการทบทวนการออกแบบและพบว่ามีความน่าจะเป็นของบางสถานการณ์คือ "น้อยกว่าความเสี่ยงของรังสีคอสมิก" ที่มีผลต่อโปรแกรมและมันเกิดขึ้นกับฉันว่าฉันไม่ได้มีความคิดที่ลึกซึ้งที่สุด ความน่าจะเป็นคือ "ตั้งแต่ 2 -128คือ 1 จาก 340282366920938463463374607431768211456 ฉันคิดว่าเราเป็นธรรมในการใช้โอกาสของเราที่นี่แม้ว่าการคำนวณเหล่านี้จะถูกปิดด้วยปัจจัยไม่กี่พันล้าน ... เรามีความเสี่ยงมากสำหรับรังสีคอสมิก เชื่อเรา โปรแกรมเมอร์นี้ถูกต้องหรือไม่? ความน่าจะเป็นที่รังสีคอสมิคชนกับคอมพิวเตอร์และมีผลกระทบต่อการทำงานของโปรแกรมอย่างไร

24
วิธีการนับจำนวนบรรทัดทั้งหมดที่เปลี่ยนแปลงโดยผู้เขียนเฉพาะในที่เก็บ Git?
มีคำสั่งที่ฉันสามารถเรียกใช้ซึ่งจะนับบรรทัดที่เปลี่ยนแปลงโดยผู้แต่งเฉพาะในที่เก็บ Git หรือไม่? ฉันรู้ว่าต้องมีวิธีนับจำนวนการคอมมิชชันที่ Github ทำกับกราฟผลกระทบ

30
มีฟังก์ชันในตัวสำหรับค้นหาโหมดหรือไม่
ใน R mean()และmedian()เป็นฟังก์ชั่นมาตรฐานที่ทำในสิ่งที่คุณคาดหวัง mode()บอกโหมดการเก็บข้อมูลภายในของวัตถุไม่ใช่ค่าที่เกิดขึ้นมากที่สุดในการโต้แย้ง แต่มีฟังก์ชันไลบรารีมาตรฐานที่ใช้โหมดสถิติสำหรับเวกเตอร์ (หรือรายการ) หรือไม่?
392 r  statistics  r-faq 

12
การสร้างสถิติจากที่เก็บ Git
ฉันกำลังมองหาเครื่องมือ / สคริปต์ที่ดีที่ทำให้ฉันสามารถสร้างสถิติเล็กน้อยจากที่เก็บ git ฉันเคยเห็นคุณสมบัตินี้ในเว็บไซต์ที่ให้บริการรหัสบางแห่งและพวกเขามีข้อมูลเช่น ... กระทำต่อผู้เขียน กระทำต่อวัน / สัปดาห์ / ปี / ฯลฯ บรรทัดของรหัสในช่วงเวลา กราฟ ... ล้นหลาม โดยทั่วไปฉันแค่ต้องการทราบว่าโครงการของฉันเติบโตขึ้นเมื่อเวลาผ่านไปเท่าใดนักพัฒนาคนใดที่ยอมรับโค้ดส่วนใหญ่และอื่น ๆ
373 git  graph  statistics 

12
การคำนวณค่าเฉลี่ยเลขคณิต (หนึ่งประเภทเฉลี่ย) ใน Python
มีวิธีการในตัวหรือไลบรารีมาตรฐานใน Python เพื่อคำนวณค่าเฉลี่ยเลขคณิต (ค่าเฉลี่ยหนึ่งประเภท) ของรายการตัวเลขหรือไม่?

11
ฉันจะคำนวณเปอร์เซ็นไทล์ด้วย python / numpy ได้อย่างไร
มีวิธีที่สะดวกในการคำนวณเปอร์เซนต์ไทล์สำหรับลำดับหรืออาร์เรย์มิติเดียวหรือไม่? ฉันกำลังมองหาบางสิ่งที่คล้ายกับฟังก์ชันเปอร์เซ็นต์ไทล์ของ Excel ฉันดูในการอ้างอิงสถิติของ NumPy และไม่พบสิ่งนี้ ทั้งหมดที่ฉันสามารถหาได้คือค่ามัธยฐาน (เปอร์เซ็นไทล์ที่ 50) แต่ไม่ใช่สิ่งที่เฉพาะเจาะจงมากขึ้น

30
วิธีง่ายๆในการคำนวณค่ามัธยฐานด้วย MySQL
อะไรคือวิธีที่ง่ายที่สุด (และหวังว่าจะไม่ช้าเกินไป) ในการคำนวณค่ามัธยฐานด้วย MySQL? ฉันใช้AVG(x)เพื่อหาค่าเฉลี่ย แต่ฉันมีเวลายากที่จะหาวิธีง่ายๆในการคำนวณค่ามัธยฐาน สำหรับตอนนี้ฉันกลับแถวทั้งหมดไปที่ PHP ทำการเรียงลำดับแล้วเลือกแถวกลาง แต่แน่นอนว่าต้องมีวิธีการง่ายๆในแบบสอบถาม MySQL เดียว ข้อมูลตัวอย่าง: id | val -------- 1 4 2 7 3 2 4 2 5 9 6 8 7 3 เรียงลำดับตามการvalให้2 2 3 4 7 8 9ดังนั้นค่ามัธยฐานควรจะเป็น4เมื่อเทียบกับSELECT AVG(val)ที่ 5==
207 sql  mysql  statistics  median 

12
วิธีการทำให้ปกติอาร์เรย์ใน NumPy?
ฉันต้องการมีบรรทัดฐานของอาร์เรย์ NumPy หนึ่งชุด โดยเฉพาะอย่างยิ่งฉันกำลังมองหารุ่นที่เทียบเท่าของฟังก์ชั่นนี้ def normalize(v): norm = np.linalg.norm(v) if norm == 0: return v return v / norm มีอะไรแบบนั้นในskearnหรือnumpyเปล่า? ฟังก์ชันนี้ทำงานในสถานการณ์ที่vเป็น 0 เวกเตอร์

16
การคำนวณสหสัมพันธ์ของเพียร์สันและความสำคัญใน Python
ฉันกำลังมองหาฟังก์ชั่นที่รับเป็นรายการสองรายการและคืนค่าความสัมพันธ์ของเพียร์สันและความสำคัญของความสัมพันธ์

5
np.mean () vs np.average () ใน Python NumPy?
ฉันสังเกตเห็นว่า In [30]: np.mean([1, 2, 3]) Out[30]: 2.0 In [31]: np.average([1, 2, 3]) Out[31]: 2.0 อย่างไรก็ตามควรมีความแตกต่างเนื่องจากหลังจากพวกเขาเป็นสองหน้าที่แตกต่างกัน ความแตกต่างระหว่างพวกเขาคืออะไร?

14
เวิร์กโฟลว์สำหรับการวิเคราะห์เชิงสถิติและการเขียนรายงาน
ไม่มีใครมีภูมิปัญญาในเวิร์กโฟลว์สำหรับการวิเคราะห์ข้อมูลที่เกี่ยวข้องกับการเขียนรายงานที่กำหนดเองหรือไม่? การใช้เคสเป็นแบบนี้: ลูกค้ารายงานค่าคอมมิชชั่นที่ใช้การวิเคราะห์ข้อมูลเช่นการประมาณประชากรและแผนที่ที่เกี่ยวข้องสำหรับเขตน้ำ นักวิเคราะห์ดาวน์โหลดข้อมูลบางส่วนรวมข้อมูลและบันทึกผลลัพธ์ (เช่นการเพิ่มคอลัมน์สำหรับประชากรต่อหน่วยหรือการย่อยข้อมูลตามขอบเขตเขต) นักวิเคราะห์วิเคราะห์ข้อมูลที่สร้างใน (2) เข้าใกล้เป้าหมายของเธอ แต่เห็นว่าต้องการข้อมูลมากขึ้นและกลับไปที่ (1) ล้างซ้ำจนกระทั่งตารางและกราฟิกตรงตาม QA / QC และทำให้ลูกค้าพึงพอใจ เขียนรายงานผสมผสานตารางและกราฟิก ปีหน้าลูกค้าที่มีความสุขกลับมาและต้องการการอัปเดต สิ่งนี้ควรเป็นเรื่องง่ายเหมือนการอัปเดตข้อมูลอัปสตรีมด้วยการดาวน์โหลดใหม่ (เช่นได้รับใบอนุญาตก่อสร้างจากปีที่แล้ว) และกดปุ่ม "คำนวณ" เว้นแต่ว่าข้อกำหนดจะเปลี่ยนไป ในขณะนี้ฉันเพิ่งเริ่มไดเรกทอรีและเฉพาะกิจมันที่ดีที่สุดที่ฉันสามารถทำได้ ฉันต้องการวิธีการที่เป็นระบบมากขึ้นดังนั้นฉันหวังว่าจะมีใครบางคนคิดออก ... ฉันใช้สเปรดชีต, SQL, ARCGIS, R และ Unix ขอบคุณ! PS: ด้านล่างเป็น Makefile พื้นฐานที่ตรวจสอบการพึ่งพาชุดข้อมูลกลาง (w / .RDataส่วนต่อท้าย) และสคริปต์ ( .Rส่วนต่อท้าย) ต่างๆ Make ใช้ timestamps เพื่อตรวจสอบการขึ้นต่อกันดังนั้นหากคุณคุณtouch ss07por.csvจะเห็นว่าไฟล์นี้ใหม่กว่าไฟล์ / เป้าหมายทั้งหมดที่ขึ้นอยู่กับมันและรันสคริปต์ที่กำหนดเพื่ออัปเดตให้สอดคล้องกัน …


8
เหมาะสมกับการกระจายเชิงประจักษ์กับทฤษฎีด้วย Scipy (Python)?
คำนำ : ฉันมีรายการค่าจำนวนเต็มมากกว่า 30,000 ค่าตั้งแต่ 0 ถึง 47 โดยรวม[0,0,0,0,..,1,1,1,1,...,2,2,2,2,...,47,47,47,...]ตัวอย่างจากตัวอย่างจากการแจกแจงแบบต่อเนื่อง ค่าในรายการไม่จำเป็นต้องเป็นไปตามลำดับ แต่คำสั่งซื้อไม่สำคัญสำหรับปัญหานี้ ปัญหา : ตามการแจกแจงของฉันฉันต้องการคำนวณค่า p (ความน่าจะเป็นที่จะเห็นค่ามากขึ้น) สำหรับค่าใด ๆ ตัวอย่างเช่นคุณสามารถดูค่า p สำหรับ 0 จะเข้าใกล้ 1 และ p-value สำหรับตัวเลขที่สูงขึ้นจะมีแนวโน้มเป็น 0 ฉันไม่รู้ว่าฉันถูกต้องหรือไม่ แต่เพื่อกำหนดความน่าจะเป็นฉันคิดว่าฉันต้องใส่ข้อมูลของฉันให้เหมาะกับการแจกแจงเชิงทฤษฎีที่เหมาะสมที่สุดในการอธิบายข้อมูลของฉัน ฉันคิดว่าจำเป็นต้องมีการทดสอบความพอดีบางประเภทเพื่อกำหนดรูปแบบที่ดีที่สุด มีวิธีดำเนินการวิเคราะห์เช่นนี้ใน Python ( ScipyหรือNumpy) หรือไม่? คุณสามารถนำเสนอตัวอย่างใด ๆ ขอบคุณ!

12
ส่งออกข้อมูลจากเครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ Chrome
การวิเคราะห์เครือข่ายโดย Chrome เมื่อโหลดหน้าเว็บ ฉันต้องการส่งออกข้อมูลนี้ไปยัง Microsoft Excel เพื่อให้ฉันมีรายการของข้อมูลที่คล้ายกันเมื่อโหลดในเวลาที่ต่างกัน การโหลดหน้าหนึ่งครั้งไม่ได้บอกอะไรมากมายโดยเฉพาะถ้าฉันต้องการเปรียบเทียบหน้า เป็นไปได้ไหมที่จะทำเช่นนี้ผ่านเครื่องมือหรือส่วนขยายของโครเมี่ยม

12
การถดถอยเชิงเส้นพหุคูณใน Python
ฉันไม่พบไลบรารี python ที่ทำการถดถอยแบบทวีคูณ สิ่งเดียวที่ฉันพบคือการถดถอยอย่างง่ายเท่านั้น ฉันต้องถอยหลังตัวแปรตาม (y) เทียบกับตัวแปรอิสระหลายตัว (x1, x2, x3 ฯลฯ ) ตัวอย่างเช่นด้วยข้อมูลนี้: print 'y x1 x2 x3 x4 x5 x6 x7' for t in texts: print "{:>7.1f}{:>10.2f}{:>9.2f}{:>9.2f}{:>10.2f}{:>7.2f}{:>7.2f}{:>9.2f}" / .format(t.y,t.x1,t.x2,t.x3,t.x4,t.x5,t.x6,t.x7) (ผลลัพธ์สำหรับด้านบน :) y x1 x2 x3 x4 x5 x6 x7 -6.0 -4.95 -5.87 -0.76 14.73 4.02 0.20 0.45 -5.0 -4.55 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.