คำถามติดแท็ก statistics

5
** วงจรปั่นหมุนของฮาร์ดดิสก์มีอันตรายอย่างไร?
มันเป็นภูมิปัญญาดั้งเดิม¹ที่แต่ละครั้งที่คุณหมุนฮาร์ดดิสก์ลงและสำรองคุณโกนเวลาบางส่วนออกจากอายุขัยของมัน หัวข้อได้รับการหารือก่อน: การปิดฮาร์ดดิสก์เป็นอันตรายหรือไม่ เอฟเฟกต์ของโหมดสแตนด์บาย (Spindown) บนฮาร์ดไดรฟ์สมัยใหม่คืออะไร คำอธิบายทั่วไปสำหรับสาเหตุที่สปินดาวน์และสปิปอัปเป็นอันตรายคือพวกมันทำให้เกิดความเครียดในชิ้นส่วนทางกลมากกว่าการวิ่งแบบธรรมดาและทำให้เกิดการเปลี่ยนแปลงของความร้อนที่เป็นอันตรายต่อกลไกของอุปกรณ์ มีข้อมูลใดแสดงปริมาณเป็นวัฏจักรของการปั่นหมาดไหม? นั่นคือวิธีการมากอายุขัยไม่เสียค่าใช้จ่ายรอบการหมุน? หรือในทางปฏิบัติถ้าฉันรู้ว่าฉันไม่ต้องการดิสก์เป็นเวลา X วินาที X จะมีขนาดใหญ่แค่ไหนที่จะรับประกันการหมุน ¹ แต่ภูมิปัญญาดั้งเดิมเคยผิดมาก่อน ยกตัวอย่างเช่นเป็นเรื่องปกติที่ฮาร์ดดิสก์ควรถูกเก็บไว้ให้เย็นที่สุดเท่าที่จะเป็นไปได้ แต่การศึกษาที่ตีพิมพ์ครั้งหนึ่งในหัวข้อแสดงให้เห็นว่า การศึกษานี้ไม่ได้ช่วยอะไรที่นี่เนื่องจากดิสก์ทั้งหมดที่สำรวจถูกขับเคลื่อนบน 24/7

4
ทำไมผู้ผลิตต่างกันถึงมีค่าสมาร์ทต่างกัน
ครั้งแรกของทั้งหมดผมคิดว่าทุกคนรู้ว่าฮาร์ดไดรฟ์ล้มเหลวมากขึ้นกว่าที่ผู้ผลิตต้องการที่จะยอมรับ Google ทำการศึกษาซึ่งบ่งชี้ว่าคุณลักษณะข้อมูลดิบบางอย่างที่สถานะ SMART ของรายงานฮาร์ดไดรฟ์สามารถมีความสัมพันธ์อย่างมากกับความล้มเหลวในอนาคตของไดรฟ์ ตัวอย่างเช่นเราพบว่าหลังจากข้อผิดพลาดในการสแกนครั้งแรกไดรฟ์มีแนวโน้มที่จะล้มเหลว 39 ครั้งภายใน 60 วันกว่าไดรฟ์ที่ไม่มีข้อผิดพลาดดังกล่าว ข้อผิดพลาดครั้งแรกในการจัดสรรใหม่การจัดสรรใหม่แบบออฟไลน์และการนับเชิงปริมาณมีความสัมพันธ์อย่างมากกับความน่าจะเป็นของความล้มเหลวที่สูงขึ้น แม้จะมีความสัมพันธ์ที่แข็งแกร่งเหล่านี้เราพบว่ารูปแบบการทำนายความล้มเหลวตามพารามิเตอร์ SMART เพียงอย่างเดียวนั้นมีแนวโน้มที่จะถูก จำกัด อย่างรุนแรงในความแม่นยำในการทำนายของพวกเขาเนื่องจากไดรฟ์ที่ล้มเหลวส่วนใหญ่ของเรา Seagate ดูเหมือนว่ากำลังพยายามปิดบังข้อมูลนี้เกี่ยวกับไดรฟ์ของพวกเขาโดยอ้างว่ามีเพียงซอฟต์แวร์ของพวกเขาเท่านั้นที่สามารถกำหนดสถานะที่ถูกต้องของไดรฟ์ได้และวิธีการที่ซอฟต์แวร์ของพวกเขาจะไม่บอกค่าข้อมูลดิบ Western Digital ไม่ได้อ้างสิทธิ์ในความรู้ของฉัน แต่เครื่องมือการรายงานสถานะของพวกเขาไม่ปรากฏขึ้นเพื่อรายงานค่าข้อมูลดิบเช่นกัน ฉันใช้ HDtune และ smartctl จาก smartmontools เพื่อรวบรวมค่าข้อมูลดิบสำหรับแต่ละแอตทริบิวต์ ฉันพบว่าจริง ๆ แล้ว ... ฉันกำลังเปรียบเทียบแอปเปิ้ลกับส้มเมื่อพูดถึงคุณลักษณะบางอย่าง ฉันได้พบตัวอย่างเช่นไดรฟ์ซีเกทส่วนใหญ่จะรายงานว่าพวกเขามีข้อผิดพลาดในการอ่านหลายล้านในขณะที่ดิจิตอลตะวันตก 99% ของเวลาแสดง 0 สำหรับข้อผิดพลาดในการอ่าน ฉันยังพบว่า Seagate จะรายงานข้อผิดพลาดในการค้นหาหลายล้านรายการในขณะที่ Western Digital มักจะรายงาน 0 ถาม : ฉันจะทำให้ข้อมูลนี้เป็นมาตรฐานได้อย่างไร Seagate …

2
ความน่าเชื่อถือในการเก็บรักษาระยะยาวของสื่อต่างๆ
ฉันกำลังมองหาข้อมูลอ้างอิงของสถิติเกี่ยวกับความน่าเชื่อถือในการจัดเก็บ / เก็บถาวรในระยะยาวสำหรับสื่อประเภทต่างๆ นั่นคือฉันกำลังมองหาข้อมูลการเปรียบเทียบแผนภูมิกราฟผลการทดสอบและอื่น ๆ เกี่ยวกับระยะเวลาที่สามารถจัดเก็บข้อมูลไว้ในสื่อประเภทต่างๆได้อย่างเชื่อถือได้มากที่สุด (เช่นฟลอปปี้เทปเทปซีดีดีวีดีแฟลช ไดรฟ์ / การ์ดหน่วยความจำ, HD, SSD, เฟิร์มแวร์อุปกรณ์ / EEPROMS, heck, แม้แต่การ์ดเจาะรูและแท็บเล็ตหินหากมี) เห็นได้ชัดว่าจะไม่มีข้อมูลในสิ่งที่ต้องการความน่าเชื่อถือ 50 ปีสำหรับดีวีดี แต่สันนิษฐานว่าข้อมูลจะได้รับการปรับปรุงเมื่อเวลาผ่านไปคล้ายกับฐานข้อมูลเปรียบเทียบโปรแกรมป้องกันไวรัส

4
Mean Time to Failure (MTTF): เมื่อผู้ผลิตดิสก์โพสต์สิ่งนี้คุณควรตีความตัวเลขของพวกเขาอย่างไร
เวลาหมายถึงความล้มเหลว (MTTF) มักจะได้รับในแง่ของชั่วโมงและโดยการทำคำนวณบางอย่างมันก็ดูเหมือนว่าดิสก์ควรจะล้มเหลวเท่านั้นหลังจากที่ตัวเลขที่ดีของปีได้หายไปโดย ดูเหมือนว่าดิสก์ต้องการการซ่อมแซมบ่อยกว่านั้น ไม่มีใครรู้ว่าทำไมถึงเป็นเช่นนี้? ฉันคิดว่ามีบางสิ่งบางอย่างเกี่ยวกับตัวชี้วัดนี้ ฉันกำลังตีความบางสิ่งผิดปกติที่นี่หรือ

5
เป็นไปได้หรือไม่ที่จะวิเคราะห์ขนาดของพื้นที่เก็บข้อมูล SubVersion?
เป็นไปได้หรือไม่ที่จะทราบจำนวนพื้นที่ดิสก์ในแต่ละโปรเจ็กต์ในที่เก็บ SubVersion ฉันสามารถตรวจสอบสำเนาการทำงานของแต่ละโครงการและดูขนาดที่แต่ละโครงการใช้ แต่ฉันไม่คิดว่าจะครอบคลุมขนาดทั้งหมดของโครงการ (การแก้ไขทั้งหมด) ฉันสามารถดูภายใต้ไดเรกทอรี "db" ของที่เก็บ แต่ไม่มีไฟล์ใดในนั้นที่เหมาะสม - ฉันไม่คิดว่ามันเป็นไปได้ที่จะใช้มันเพื่อหาว่ามีพื้นที่ว่างเท่าใดในแต่ละโครงการ ฉันลองใช้svn ls --verboseคำสั่ง แต่ขนาดที่ให้ฉันเป็นแค่ขนาดของไฟล์จริงในการแก้ไขส่วนหัวฉันไม่คิดว่ามันจะมีการแก้ไขทั้งหมด อาจเป็นไปไม่ได้ แต่ฉันคิดว่าฉันจะถาม ขอบคุณล่วงหน้า!

3
แอปพลิเคชันเพื่อรวบรวมสถิติการใช้เมาส์ [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับผู้ใช้ขั้นสูง ปิดให้บริการใน3 ปีที่ผ่านมา แอปพลิเคชันใด ๆ ที่สามารถรวบรวมและวิเคราะห์สถิติเกี่ยวกับการใช้เมาส์ได้ ตัวอย่างเช่น: ความเร็วในการเคลื่อนที่ของเมาส์จำนวนการคลิกที่มีประสิทธิผลและไม่ก่อผล ฯลฯ ยิ่งการวิเคราะห์มากเท่าไหร่ก็ยิ่งดีเท่านั้น ฉันได้ดู anti-mousing มันใกล้เคียงที่สุดที่ฉันได้พบกับการใช้งานของฉันขออภัยสถิติที่รีเซ็ตทุกครั้งที่คุณปิดโปรแกรม ฉันต้องการโปรแกรมเพื่อรวบรวมสถิติสำหรับการวิเคราะห์ระยะยาว PS: โปรแกรมใด ๆ ที่คล้ายกันสำหรับการใช้แป้นพิมพ์ด้วย

6
มีซอฟต์แวร์ที่ทำการวิเคราะห์ข้อความบนบล็อกหรือไม่ [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับผู้ใช้ขั้นสูง ปิดให้บริการใน3 ปีที่ผ่านมา บริษัท ของฉันกำลังมองหาการสร้างภาพข้อมูล PivotViewer ของบล็อก Wordpress 2 ของลูกค้าในช่วง 11 ปีที่ผ่านมา อย่างไรก็ตามในการทำเช่นนั้นเราจำเป็นต้องแก้ไขแท็กที่จับจดไม่สมบูรณ์และโดยทั่วไปไม่ดีเพื่อใช้เป็นหมวดหมู่ที่จัดเรียงได้ ฉันกำลังมองหาเครื่องมือที่จะวิเคราะห์รายการบล็อกของพวกเขาและทำการนับจำนวนคำเพื่อให้เราเข้าใจว่าเรากำลังทำอะไรอยู่ เป็นการดีที่มันจะมีคุณสมบัติเหล่านี้ทั้งหมด: บัญชีดำ Word (เพิกเฉย) การเกิดคำ การรวมคำเหมือนที่กำหนดเอง การนับการใช้งานทั้งหมด การนับจำนวนโพสต์คำปรากฏขึ้น ฉันคิดว่าการวิเคราะห์ข้อความแบบนี้จะเป็นเรื่องธรรมดามาก แต่ฉันไม่สามารถหาซอฟต์แวร์ใด ๆ ที่ทำสิ่งนี้ในบล็อกทั้งหมด มีซอฟต์แวร์ให้ทำเช่นนี้หรือไม่?

2
คำนวณค่ามัธยฐานตามจำนวนของค่า
ฉันมีข้อมูลจำนวน CPU เฉพาะที่เรามีและเครื่องหมายของ CPU จากนี้ฉันต้องการคำนวณสถิติค่ามัธยฐานและควอไทล์แบบไดนามิก ตัวอย่างเช่นฉันมีตารางที่ดูเหมือน เครื่องหมายการนับชื่อ i7-5820k 3,3 GHz 6 คอร์ 11 12,996 i7-950 3,1 GHz 4 คอร์ 4 5595 i7-3820 3,6 GHz 4 คอร์ 7 8998 i5-3570k 3,4 GHz 4 คอร์ 1 7153 สิ่งที่ฉันต้องการจะทำกับข้อมูลคือการนับคะแนนของแถวแรก 11 ครั้งที่สองหนึ่ง 4 ครั้งและอื่น ๆ ปัจจุบันสามารถใช้งานได้กับ Google Spreadsheets แต่ฉันคิดว่าควรมีฟังก์ชั่นที่คล้ายกันในแอปพลิเคชันสเปรดชีตส่วนใหญ่

1
เซิร์ฟเวอร์ Ubuntu หลายตัว - สถิติอย่างรวดเร็ว
ฉันเพิ่งเรียนรู้เกี่ยวกับ Ubuntu Landscape - แต่สำหรับจุดประสงค์ของฉันมันเกินความจริงและดูเหมือนว่ามันไม่ฟรี ฉันมี 3 เซิร์ฟเวอร์และฉันต้องการเยี่ยมชมเว็บไซต์เดียวที่ให้ข้อมูลสรุปโดยย่อเกี่ยวกับการโหลดเซิร์ฟเวอร์เหล่านั้น ข้อมูลเดียวกันที่สามารถรับได้โดย top, uptime และ who. มีเซิร์ฟเวอร์ / ไคลเอ็นต์ที่พร้อมใช้งานอยู่แล้วหรือไม่

1
ฮาร์ดแวร์ใดที่สำคัญที่สุดสำหรับการดำเนินการแบบกระจาย [ปิด]
ฉันทำการคำนวณทางสถิติจำนวนมากใน R โดยเฉพาะการวิเคราะห์ข้อความที่เกี่ยวข้องกับการดำเนินการเมทริกซ์แบบกระจาย รายละเอียดฮาร์ดแวร์ใดที่สำคัญที่สุดสำหรับการปรับกระบวนการเหล่านี้ให้เหมาะสม กำลังประมวลผลหน่วยความจำแกน?
1 statistics  r 

2
รายการและนับคำที่ไม่ซ้ำจากเอกสาร Word [ปิด]
ฉันต้องการนำเอกสาร Microsoft Word และสร้างสเปรดชีตของคำทั้งหมดที่มีอยู่ในเอกสารและจำนวนครั้งที่แต่ละคำปรากฏ เช่น., cat 23 said 15 jumped 12 dog 7 นี่เป็นปัญหาที่ไม่ยุ่งยากหรือไม่ที่สามารถทำได้อย่างง่ายดายและตรงไปตรงมาโดยใช้ฟังก์ชั่นและฟีเจอร์ต่าง ๆ ของ Word หรือ Excel? ถ้าไม่มีฟังก์ชั่นนี้จะพร้อมใช้งานในเครื่องมือแบบไม่ใช้งาน (ในกรณีนี้โปรดแนะนำสิ่งที่ฉันควรสอบถามเกี่ยวกับเว็บไซต์ Recs ซอฟต์แวร์) หรือต้องการโปรแกรมแบบกำหนดเองหรือไม่

0
การวิเคราะห์ทางสถิติบนชุดข้อมูล google play store
ฉันมีชุดข้อมูลขนาดใหญ่เกี่ยวกับแอปพลิเคชัน Google Play Store และฉันต้องการทำการวิเคราะห์ทางสถิติและใช้อัลกอริทึมที่เกี่ยวข้อง ฉันไม่มีความคิดใด ๆ เกี่ยวกับการวิเคราะห์ประเภทนี้ มีอัลกอริทึมบางอย่างที่ฉันสามารถทำกับชุดข้อมูลของฉันได้ไหม และมีความสัมพันธ์ b / w การวิเคราะห์ทางสถิติและการเรียนรู้ของเครื่อง ??? หากคุณมีความคิดใด ๆ โปรดแจ้งให้เราทราบเกี่ยวกับมันและเกี่ยวกับชื่อของอัลกอริทึม หากมีลิงค์ที่มีประโยชน์กรุณาใส่ไว้ที่นี่

0
Kibana - ฉันจะเห็นภาพจำนวนงานที่ทำอยู่ได้อย่างไร
ฉันกำลังทดลองกับ Kibana (ELK Stack) ในขณะนี้และฉันสงสัยว่ามันเป็นไปได้หรือไม่: ฉันมีข้อมูลที่มีการประทับเวลาซึ่งเป็นจุดเริ่มต้นของงานและเขตข้อมูลที่ให้ระยะเวลาของงานนั้นในไม่กี่วินาที ฉันสามารถรวมเวลาสิ้นสุดด้วย แต่ในขณะนี้ฉันไม่มีสิ่งนั้น ตอนนี้ฉันต้องการที่จะเห็นภาพจำนวนของงานที่ใช้งานในเวลาที่กำหนด ไม่มีปัญหาในการแสดงจำนวนงานที่เริ่มต้นในเวลาที่กำหนด ฉันทำสิ่งนี้ด้วย "SUM of SUCCESS" (ความสำเร็จคือฟิลด์ที่มี 1 สำหรับงานที่สำเร็จ) สำหรับแกน Y สำหรับแกน X ฉันใช้ "ฮิสโทแกรมวันที่" สำหรับฟิลด์การประทับเวลา ("created_at") แต่ฉันจะบอก kibana ให้นับ "งานที่ใช้งานได้" ซึ่งหมายความว่าจะต้องมีการนับรายการด้วยเช่นกันสำหรับทุก ๆ จุดที่ตรงกับกรอบเวลาเริ่มต้นจนถึงเวลาเริ่มต้น + ระยะเวลา
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.