คำถามติดแท็ก terminology

การใช้และความหมายของคำศัพท์ / แนวคิดทางเทคนิคที่เฉพาะเจาะจงในสถิติ

3
พล็อตนี้มีชื่ออะไรที่มีแถวที่มีจุดเชื่อมต่อสองจุด
ฉันอ่านรายงาน EIA และโครงเรื่องนี้ได้รับความสนใจ ตอนนี้ฉันต้องการที่จะสร้างพล็อตประเภทเดียวกัน มันแสดงให้เห็นถึงวิวัฒนาการการผลิตพลังงานระหว่างสองปี (2533-2558) และเพิ่มมูลค่าการเปลี่ยนแปลงระหว่างสองช่วงเวลานี้ พล็อตประเภทนี้ชื่ออะไร ฉันจะสร้างพล็อตเดียวกัน (กับประเทศต่าง ๆ ) ใน excel ได้อย่างไร

5
มีอะไรในชื่อ: พารามิเตอร์
ดังนั้นในการกระจายปกติเรามีสองพารามิเตอร์: ค่าเฉลี่ยและความแปรปรวน 2 ในการจดจำรูปแบบหนังสือและการเรียนรู้ของเครื่องในทันทีทันใดจะมีพารามิเตอร์หลายพารามิเตอร์ในข้อกำหนดการทำให้เป็นปกติของฟังก์ชันข้อผิดพลาดσ 2 λμμ\muσ2σ2\sigma^2λλ\lambda พารามิเตอร์ไฮเปอร์พารามิเตอร์คืออะไร ทำไมพวกเขาถึงตั้งชื่อเช่นนี้? และพวกเขาแตกต่างจากพารามิเตอร์ทั่วไปอย่างไร

1
ตรงข้ามของความแปรปรวน
มีคำว่า 'ผกผันของความแปรปรวน' หรือไม่? นั่นคือถ้ามีความแปรปรวนสูงแล้วมีต่ำ ? ไม่สนใจคำตรงข้ามที่ใกล้เคียง (เช่น 'ข้อตกลง' หรือ 'ความคล้ายคลึง') แต่มีความหมายเฉพาะ ?X … 1 / σ 2XXXXXX......\dots1 / σ21/σ21/\sigma^2

6
การทำ data data กับการวิเคราะห์ทางสถิติต่างกันอย่างไร?
การทำ data data กับการวิเคราะห์ทางสถิติต่างกันอย่างไร? สำหรับภูมิหลังบางอย่างการศึกษาทางสถิติของฉันนั้นฉันคิดว่าเป็นแบบดั้งเดิม คำถามที่เจาะจงจะถูกวางไว้การวิจัยได้รับการออกแบบและมีการรวบรวมและวิเคราะห์ข้อมูลเพื่อนำเสนอข้อมูลเชิงลึกเกี่ยวกับคำถามนั้น ด้วยเหตุนี้ฉันจึงสงสัยในสิ่งที่ฉันคิดว่า "data dredging" อยู่เสมอนั่นคือมองหารูปแบบในชุดข้อมูลขนาดใหญ่และใช้รูปแบบเหล่านี้เพื่อสรุปผล ฉันมักจะเชื่อมโยงอย่างหลังกับ data-mining และมักจะถือว่าสิ่งนี้ค่อนข้างไร้หลักการ (พร้อมกับสิ่งต่าง ๆ เช่นรูทีนการเลือกตัวแปรอัลกอริทึม) อย่างไรก็ตามมีงานเขียนขนาดใหญ่และกำลังเติบโตเกี่ยวกับการขุดข้อมูล บ่อยครั้งที่ฉันเห็นฉลากนี้อ้างถึงเทคนิคเฉพาะเช่นการจัดกลุ่มการจำแนกตามต้นไม้เป็นต้น แต่อย่างน้อยจากมุมมองของฉันเทคนิคเหล่านี้สามารถ "ตั้งค่าหลวม ๆ " ในชุดข้อมูลหรือใช้ในรูปแบบที่มีโครงสร้างเพื่อจัดการกับ คำถาม. ฉันจะเรียกการทำเหมืองข้อมูลในอดีตและการวิเคราะห์ทางสถิติหลัง ฉันทำงานด้านการบริหารงานวิชาการและถูกขอให้ทำ "data mining" เพื่อระบุปัญหาและโอกาส สอดคล้องกับภูมิหลังของฉันคำถามแรกของฉันคือ: คุณต้องการเรียนรู้อะไรและอะไรคือสิ่งที่คุณคิดว่ามีส่วนร่วมในการแก้ไขปัญหา? จากการตอบกลับของพวกเขามันชัดเจนว่าฉันและคนที่ถามคำถามนั้นมีแนวคิดที่แตกต่างกันเกี่ยวกับลักษณะและคุณค่าของการทำเหมืองข้อมูล

1
ทำไมตัวประมาณ James-Stein จึงเรียกตัวประมาณว่า
ฉันได้อ่านเกี่ยวกับตัวประมาณ James-Stein มันถูกกำหนดไว้ในบันทึกนี้เป็น θ^=(1−p−2∥X∥2)Xθ^=(1−p−2‖X‖2)X \hat{\theta}=\left(1 - \frac{p-2}{\|X\|^2}\right)X ฉันได้อ่านหลักฐานแล้ว แต่ฉันไม่เข้าใจข้อความต่อไปนี้: ตัวประเมินเจมส์ - สไตน์ย่อตัวส่วนประกอบแต่ละส่วนของเข้าหาจุดกำเนิด ...XXX "ย่อส่วนแต่ละส่วนของไปทางต้นกำเนิด" หมายความว่าอย่างไร ฉันกำลังคิดว่าจะชอบ ซึ่งเป็นจริงในกรณีนี้ตราบใดที่ตั้งแต่ ‖ θ - 0 ‖ 2 < ‖ X - 0 ‖ 2 , ( P + 2 ) < ‖ X ‖ 2 ‖ θ ‖ = ‖ X ‖ 2 - …

5
'การเรียนรู้การถ่ายโอน' กับ 'การปรับโดเมน' ต่างกันอย่างไร
มี 'ความแตกต่างระหว่างการเรียนรู้การถ่ายโอน' และ 'การปรับโดเมน' หรือไม่? ฉันไม่รู้เกี่ยวกับบริบท แต่ความเข้าใจของฉันคือเรามีชุดข้อมูล 1 และฝึกอบรมหลังจากนั้นเรามีชุดข้อมูลอีก 2 ชุดที่เราต้องการปรับโมเดลของเราโดยไม่ต้องฝึกอบรมใหม่ตั้งแต่เริ่มต้นซึ่ง 'ถ่ายโอนการเรียนรู้' และ 'การปรับโดเมน' ช่วยแก้ปัญหานี้ได้ ตามข้อมูลของ Convolutional Neural Networks: โดย 'โอนการเรียนรู้' ฉันหมายถึง 'finetuning' [1] ในกรณีนี้[2]ไม่มีการสำรอง แต่ควรมีการยกเลิกการปรับโดเมน

1
เมื่อถูกคำว่า“อคติ” ประกาศเกียรติคุณหมายถึง ?
เมื่อถูกคำว่า "อคติ" ประกาศเกียรติคุณหมายถึง ?E [ θ^- θ ]E[θ^-θ]\mathbb{E}[\hat{\theta}-\theta] เหตุผลที่ฉันกำลังคิดเกี่ยวกับเรื่องนี้ในตอนนี้ก็เพราะฉันดูเหมือนจะจำ Jaynes ในข้อความทฤษฎีความน่าจะเป็นของเขาวิจารณ์การใช้คำว่า "อคติ" ที่ใช้ในการอธิบายสูตรนี้และแนะนำทางเลือกอื่น จากทฤษฎีความน่าจะเป็นของเจย์เนส, ส่วนที่ 17.2 "เครื่องมือประมาณค่าที่เป็นกลาง:" เหตุใดออร์โธดอกซ์จึงให้ความสำคัญกับความลำเอียงที่พูดเกินจริงเช่นนั้น เราสงสัยว่าเหตุผลหลักคือพวกเขาติดกับดักทางจิตของการสร้างของพวกเขาเอง เมื่อเราเรียกปริมาณ 'bias' ซึ่งทำให้ดูเหมือนสิ่งเลวทรามต่ำช้าซึ่งเราต้องกำจัดค่าใช้จ่ายทั้งหมด ถ้ามันถูกเรียกแทน 'องค์ประกอบของความผิดพลาด orthogonal กับความแปรปรวน' ตามที่แนะนำโดยรูปแบบของพีทาโกรัส (17.2) มันจะชัดเจนว่าการมีส่วนร่วมของทั้งสองข้อผิดพลาดนั้นอยู่ในระดับที่เท่าเทียมกัน มันเป็นความเขลาที่จะลดค่าใช้จ่ายในการเพิ่มอีกอันหนึ่ง นี่เป็นเพียงราคาเดียวที่จ่ายสำหรับการเลือกคำศัพท์ทางเทคนิคที่มีภาระทางอารมณ์ ออร์ทอดอกซ์ตกอยู่ในข้อผิดพลาดทางยุทธวิธีนี้อย่างต่อเนื่อง( ⟨ บีตา⟩ - α )(⟨β⟩-α)(\langle\beta\rangle-\alpha)

11
คำสำหรับ“ จำนวนคอลัมน์” ของเมทริกซ์
มีคำภาษาอังกฤษคำเดียวที่แสดงถึง "จำนวนคอลัมน์" ของเมทริกซ์หรือไม่? ยกตัวอย่างเช่น "มิติ" ของเมทริกซ์3 ฉันต้องการคำศัพท์คำสำหรับตัวอย่างนี้ ฉันสามารถพูดได้เสมอว่า "จำนวนคอลัมน์" แต่ฉันจะมีคำเดียวได้ไหม?2×32×32\times 32×32×32\times 3333

3
การอ้างถึงผลลัพธ์ว่า "สำคัญมาก" ผิดหรือไม่?
ทำไมสถิติกีดกันเราจากผลหมายถึงว่า " สูงอย่างมีนัยสำคัญ" เมื่อ -value เป็นอย่างดีดังต่อไปนี้การชุมนุมαpppαα\alphaระดับพื้นดินของ ?0.050.050.05 เป็นความผิดพลาดหรือไม่ที่จะเชื่อใจในผลลัพธ์ที่มีโอกาส 99.9% ที่ไม่ใช่ข้อผิดพลาด Type I ( ) มากกว่าผลลัพธ์ที่ให้โอกาสนั้นเพียง 99% ( p = 0.01)p=0.001p=0.001p=0.001p=0.01p=0.01p=0.01 ) หรือไม่

1
อะไรคือสิ่งที่เรียกว่า "องค์ประกอบหลัก" ใน PCA
สมมติว่าเป็นเวกเตอร์ที่เพิ่มความแปรปรวนของการประมาณการของข้อมูลที่มีการออกแบบเมทริกซ์XXuuuXXX ตอนนี้ฉันได้เห็นวัสดุที่อ้างถึงว่าเป็นองค์ประกอบหลัก (แรก) ของข้อมูลซึ่งเป็นไอเก็นเวกเตอร์ที่มีค่าลักษณะเฉพาะที่ใหญ่ที่สุดuuu แต่ผมยังได้เห็นว่าองค์ประกอบหลักของข้อมูลที่เป็นยูXuXuX u เห็นได้ชัดว่ากับเป็นคนละเรื่องกัน ใครสามารถช่วยฉันออกจากที่นี่และบอกฉันว่าอะไรคือความแตกต่างระหว่างคำจำกัดความสององค์ประกอบหลักX คุณuuuXuXuXu

5
ปริมาณนี้เกี่ยวข้องกับความเป็นอิสระมีชื่อหรือไม่?
เห็นได้ชัดว่าเหตุการณ์ A และ B มีความเป็นอิสระ IFF Pr = Pr Pr (B)มานิยามปริมาณที่เกี่ยวข้องกัน( A ) ( B )(A∩B)(A∩B)(A\cap B)(A)(A)(A)(B)(B)(B) Q≡Pr(A∩B)Pr(A)Pr(B)Q≡Pr(A∩B)Pr(A)Pr(B)Q\equiv\frac{\mathrm{Pr}(A\cap B)}{\mathrm{Pr}(A)\mathrm{Pr}(B)} ดังนั้น A และ B จึงเป็นอิสระ iff Q = 1 (สมมติว่าตัวส่วนนั้นไม่ใช่ศูนย์) Q มีชื่อจริงหรือไม่? ฉันรู้สึกเหมือนมันหมายถึงแนวคิดพื้นฐานบางอย่างที่กำลังหลบหนีฉันในตอนนี้และฉันจะรู้สึกค่อนข้างโง่ที่ได้ถามคำถามนี้

4
คำพ้องความหมาย“ ตัวอย่างสุ่ม” และ“ ตัวแปรสุ่ม iid” หรือไม่
ฉันได้รับความยากลำบากในการทำความเข้าใจความหมายของ "ตัวอย่างแบบสุ่ม" เช่นเดียวกับ "ตัวแปรแบบสุ่มของ iid" ฉันพยายามหาความหมายจากหลาย ๆ แหล่ง แต่สับสนมากขึ้นเรื่อย ๆ ฉันโพสต์ที่นี่สิ่งที่ฉันพยายามและได้รู้: ความน่าจะเป็นและสถิติของ Degroot บอกว่า: ตัวอย่างสุ่ม / IID / ตัวอย่างขนาด: พิจารณากระจายความน่าจะได้รับในบรรทัดจริงที่สามารถแสดงโดยทั้ง PF หรือไฟล์ PDF ฉได้มีการกล่าวกันว่าตัวแปรสุ่มรูปแบบตัวอย่างที่สุ่มจากการกระจายนี้ถ้าตัวแปรสุ่มเหล่านี้มีความเป็นอิสระและ PF ร่อแร่หรือ PDF ของแต่ละของพวกเขาคือฉตัวแปรสุ่มดังกล่าวถูกกล่าวถึงว่ามีความเป็นอิสระและมีการกระจายเหมือนกันโดยย่อ iid เราอ้างถึงหมายเลข n ของตัวแปรสุ่มเป็นขนาดตัวอย่างn X 1 , . . , X n ffffnnnX1,...,XnX1,...,XnX_1 , . . . , X_nfฉf แต่หนึ่งในหนังสือสถิติอื่น ๆ ที่ฉันได้พูดไป: …

3
“ การทำให้เป็นมาตรฐาน” หมายถึงอะไรและวิธีการตรวจสอบว่าตัวอย่างหรือการกระจายได้รับการทำให้เป็นมาตรฐาน
ฉันมีคำถามที่ขอให้ตรวจสอบว่าการแจกแจงแบบฟอร์ม ( Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) ) เป็นมาตรฐานหรือไม่ สำหรับหนึ่งแล้วการกระจายแบบใดที่จะทำให้เป็นมาตรฐาน และสองเราจะตรวจสอบได้อย่างไรว่าการแจกแจงเป็นแบบปกติหรือไม่? ฉันเข้าใจโดยการคำนวณ X−meansdX−meansd \frac{X-\text{mean}}{\text{sd}} เราได้รับข้อมูลที่ทำให้เป็นมาตรฐานแต่ที่นี่มันจะขอให้ตรวจสอบว่าการกระจายเป็นปกติหรือไม่

2
เหตุใดจึงเลือกตัวอักษร Q ในการเรียนรู้ Q
เหตุใดจึงเลือกตัวอักษร Q ในชื่อของ Q-learning ตัวอักษรส่วนใหญ่จะถูกเลือกเป็นตัวย่อเช่นหมายถึงนโยบายและหมายถึงคุณค่า แต่ฉันไม่คิดว่า Q เป็นคำย่อของคำใด ๆππ\pivvv

3
ทำไม“ อนุกรมเวลา” จึงเรียกเช่นนี้
ทำไม“ อนุกรมเวลา” จึงเรียกเช่นนี้ ซีรีส์หมายถึงผลรวมของลำดับ เหตุใดจึงเป็นอนุกรมเวลาไม่ใช่ลำดับเวลา คือเวลาตัวแปรอิสระ?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.