คำถามติดแท็ก notation

สำหรับคำถามเกี่ยวกับสัญกรณ์ทางสถิติและสัญกรณ์ทางคณิตศาสตร์ที่ใช้ในสถิติ

1
สัญกรณ์ห้อยในความคาดหวัง
ความหมายที่แท้จริงของสัญกรณ์ห้อยคืออะไรในความคาดหวังตามเงื่อนไขในกรอบของทฤษฎีการวัด? ห้อยเหล่านี้จะไม่ปรากฏในความหมายของความคาดหวังที่มีเงื่อนไข แต่เราอาจจะเห็นเช่นในหน้าของวิกิพีเดียนี้ (โปรดทราบว่ามันไม่ได้เป็นอย่างนั้นเสมอไปในสองสามเดือนก่อนหน้านี้ )EX[f(X)]EX[f(X)]\mathbb{E}_X[f(X)] สิ่งที่ควรเป็นเช่นความหมายของกับและ ?EX[X+Y]EX[X+Y]\mathbb{E}_X[X+Y]X∼N(0,1)X∼N(0,1)X\sim\mathcal{N}(0,1)Y=X+1Y=X+1Y=X+1


2
เหตุใดจึงมีการกำหนด / การสูญเสียข้อมูลสองรายการที่แตกต่างกันในโลจิสติกส์
ฉันได้เห็นสูตรการสูญเสียโลจิสติกสองประเภท เราสามารถแสดงให้พวกเขามีความเหมือนที่แตกต่างเพียงอย่างเดียวคือความหมายของฉลากYyyy สูตร / สัญกรณ์ 1, :y∈{0,+1}y∈{0,+1}y \in \{0, +1\} L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) โดยที่โดยที่ฟังก์ชันโลจิสติกแมปจำนวนจริงเป็น 0,1 ช่วงเวลาp=11+exp(−βTx)p=11+exp⁡(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)}βTxβTx\beta^T x สูตร / สัญกรณ์ 2, :y∈{−1,+1}y∈{−1,+1}y \in \{-1, +1\} L(y,βTx)=log(1+exp(−y⋅βTx))L(y,βTx)=log⁡(1+exp⁡(−y⋅βTx)) L(y,\beta^Tx)=\log(1+\exp{(-y\cdot \beta^Tx})) การเลือกสัญกรณ์ก็เหมือนกับการเลือกภาษามีข้อดีข้อเสียที่จะใช้อย่างใดอย่างหนึ่ง ข้อดีและข้อเสียของเครื่องหมายทั้งสองนี้คืออะไร ความพยายามของฉันที่จะตอบคำถามนี้คือดูเหมือนว่าชุมชนสถิติชอบสัญกรณ์แรกและชุมชนวิทยาศาสตร์คอมพิวเตอร์ชอบสัญกรณ์ที่สอง สัญกรณ์แรกสามารถอธิบายได้ด้วยคำว่า "ความน่าจะเป็น" เนื่องจากฟังก์ชันโลจิสติกจะแปลงจำนวนจริงเป็นช่วงเวลา 0,1βTxβTx\beta^Tx และสัญกรณ์ที่สองนั้นรัดกุมกว่าและง่ายกว่าที่จะเปรียบเทียบกับการสูญเสียบานพับหรือการสูญเสีย 0-1 ฉันถูกไหม? ข้อมูลเชิงลึกอื่น ๆ

3
ในการเรียนรู้ของเครื่องทำไมตัวยกส่วนเกินจึงใช้แทนตัวห้อย?
ฉันสละแน่นอนแอนดรูอึ้งบนเครื่องการเรียนรู้ผ่าน Coursera สำหรับสมการตัวยกจะถูกใช้แทนตัวห้อย ตัวอย่างเช่นในสมการต่อไปนี้ใช้แทน : x ix( i )x(ผม)x^{(i)}xผมxผมx_i J( θ0, θ1) = 12 มΣi = 1ม.( ชมθ( x( i )) - y( i ))2J(θ0,θ1)=12ม.Σผม=1ม.(ชั่วโมงθ(x(ผม))-Y(ผม))2J(\theta_0, \theta_1) = \frac{1}{2m} \sum\limits_{i=1}^{m}{(h_\theta(x^{(i)}) - y^{(i)})^2} เห็นได้ชัดว่านี่เป็นเรื่องธรรมดา คำถามของฉันคือเหตุใดจึงใช้ตัวยกแทนตัวห้อย? Superscripts ถูกใช้แล้วสำหรับการยกกำลัง จริงอยู่ที่ฉันดูเหมือนจะสามารถแยกแยะความแตกต่างระหว่างกรณียกและยกกำลังใช้กรณีโดยให้ความสนใจกับวงเล็บอยู่หรือไม่ แต่มันก็ดูเหมือนจะทำให้เกิดความสับสน


2
อะไรคือความหมายของ super script 2 subscript 2 ภายในบริบทของบรรทัดฐาน?
ฉันใหม่สำหรับการเพิ่มประสิทธิภาพ ฉันเห็นสมการที่มีตัวยก 2 และตัวห้อย 2 อยู่ทางด้านขวาของบรรทัดฐาน ตัวอย่างเช่นนี่คือสมการกำลังสองน้อยที่สุด ต่ำสุด||Ax−b||22||Ax−b||22 ||Ax-b||^2_2 ฉันคิดว่าฉันเข้าใจตัวยกที่ 2: มันหมายถึงการเพิ่มมูลค่าของบรรทัดฐาน แต่ตัวห้อยคืออะไร ฉันจะอ่านสมการเหล่านี้ได้อย่างไร

4
ในสถิติฉันควรถือว่าการ
ฉันกำลังศึกษาสถิติและมักพบสูตรที่มีlogและฉันมักสับสนถ้าฉันควรตีความว่าเป็นความหมายมาตรฐานของlogเช่นฐาน 10 หรือในสถิติสัญลักษณ์log มักจะถือว่าเป็นบันทึกธรรมชาติlnสันนิษฐานโดยทั่วไปจะบันทึกของธรรมชาติ โดยเฉพาะอย่างยิ่งฉันกำลังศึกษาการประมาณค่าความถี่ที่ดีของทัวริงเป็นตัวอย่าง แต่คำถามของฉันเป็นคำถามทั่วไปมากกว่า


1
ต้นกำเนิดของสัญกรณ์สไตล์วิลกินสันเช่น (1 | id) สำหรับเอฟเฟกต์แบบสุ่มในสูตรโมเดลผสมใน R
สูตรโมเดลใน R เช่น y ~ x + a*b + c:d จะขึ้นอยู่กับที่เรียกว่าสัญกรณ์วิลกินสัน : วิลกินสันและโรเจอร์ส 1973 สัญลักษณ์คำอธิบายของปัจจัยรุ่นสำหรับการวิเคราะห์ความแปรปรวน บทความนี้ไม่ได้กล่าวถึงสัญลักษณ์สำหรับรุ่นผสม (ซึ่งอาจไม่มีอยู่ในตอนนั้น) ดังนั้นสูตรผสมโมเดลที่ใช้ในlme4และแพ็คเกจที่เกี่ยวข้องใน R เช่น y ~ x + a*b + c:d + (1|school) + (a*b||town) มาจาก? ใครแนะนำพวกเขาเป็นครั้งแรกและเมื่อไหร่ มีข้อตกลงใด ๆ เช่นคำว่า "สัญกรณ์วิลกินสัน" สำหรับพวกเขาหรือไม่? ฉันหมายถึงเฉพาะเงื่อนไขเช่น (model formula | grouping variable) (model formula || grouping variable)

2
เครื่องหมายใดและทำไม:
อนุสัญญาโวหารเหล่านี้เป็นเพียง (ไม่ว่าจะเป็นตัวเอียงหรือไม่ใช่ตัวเอียง) หรือมีความแตกต่างที่สำคัญในความหมายของสัญลักษณ์เหล่านี้หรือไม่ มีข้อความอื่น ๆ ที่มีความหมายว่า " ความน่าจะเป็น " ที่ควรพิจารณาในคำถามนี้หรือไม่

1
สัญลักษณ์ของตัวประมาณ (ตัวหนอนกับหมวก)
1. มีแบบแผนการตั้งชื่อใด ๆ เกี่ยวกับหมวกและสัญลักษณ์ตัวหนอนในสถิติหรือไม่? ฉันพบกำลังอธิบายตัวประมาณสำหรับ ( Wikipedia ) แต่ฉันก็พบกำลังอธิบายตัวประมาณสำหรับ\ beta ( Wolfram ) ความหมายต่างกันหรือไม่? บนเว็บที่ผมพบชนิดที่แตกต่าง แต่ผมไม่แน่ใจว่าเกี่ยวกับความหมายอ้างอิงสำหรับสัญลักษณ์สถิติ มีความแตกต่างระหว่าง "การประมาณค่าพารามิเตอร์" และ "การประมาณค่าตัวแปร" มีใครบางคนที่ใจดีสามารถอธิบายได้ในกรณีที่ใช้เครื่องหมายตัวหนอนและหมวก β^β^\hat{\beta}ββ\betaβ~β~\tilde{\beta}ββ\beta 2. เกี่ยวกับผู้ดำเนินการคาดหวังมีความแตกต่างในและและเกี่ยวกับวงเล็บหรือไม่ ฉันได้รับคำแนะนำให้ใช้วงเล็บปีกกา แต่ฉันไม่แน่ใจเกี่ยวกับความหมาย ฉันเคยใช้เครื่องหมายวงเล็บสำหรับการอ่าน / การสร้างภาพข้อมูลแทนที่จะชี้ไปที่ความหมายบางอย่าง มีคำแนะนำอะไรบ้าง?E( X)E(X)E(X)E[ X]E[X]E[X]E{ X}E{X}E\{X\}
15 notation 

2
สัญลักษณ์เมทริกซ์สำหรับการถดถอยโลจิสติก
ในการถดถอยเชิงเส้น (การสูญเสียกำลังสอง) การใช้เมทริกซ์เรามีสัญกรณ์ที่รัดกุมมากสำหรับวัตถุประสงค์ minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 โดยที่AAAคือเมทริกซ์ข้อมูลxxxคือสัมประสิทธิ์และbbbคือการตอบสนอง มีสัญกรณ์เมทริกซ์ที่คล้ายกันสำหรับวัตถุประสงค์การถดถอยโลจิสติก? สัญลักษณ์ทั้งหมดที่ฉันเห็นไม่สามารถกำจัดผลรวมเหนือจุดข้อมูลทั้งหมดได้ (เช่น∑dataLlogistic(y,βTx)∑dataLlogistic(y,βTx)\sum_{\text data} \text{L}_\text{logistic}(y,\beta^Tx) ) แก้ไข: ขอบคุณสำหรับ joceratops และคำตอบที่ยอดเยี่ยมของ AdamO คำตอบของพวกเขาช่วยให้ผมตระหนักดีว่าเหตุผลถดถอยเชิงเส้นอื่นมีสัญกรณ์รัดกุมมากขึ้นเป็นเพราะความหมายของบรรทัดฐานซึ่งแค็ปซูตารางและผลรวมหรือบนอี แต่ในการสูญเสียโลจิสติกไม่มีคำจำกัดความดังกล่าวซึ่งทำให้สัญกรณ์ซับซ้อนขึ้นเล็กน้อยe⊤ee⊤ee^\top e

4
วิธีแยกบริบททางสถิติ
ประการแรกฉันคิดว่าไม่ใช่สมาชิกที่ทำงานอยู่ในไซต์ที่น่าสนใจนี้ทั้งหมดเป็นนักสถิติ มิฉะนั้นคำถามที่ถูกถามดังนี้ไม่มีเหตุผลใด ๆ ! ฉันเคารพพวกเขาแน่นอน แต่ฉันต้องการคำอธิบายที่ใช้งานได้มากกว่าแนวความคิด ฉันเริ่มต้นด้วยตัวอย่างจากWikipediaเพื่อกำหนดpoint process: ให้ S เป็นพื้นที่ขนาดกะทัดรัดที่นับได้ในพื้นที่ Hausdorff ที่สองซึ่งติดตั้ง Borel σ-algebra B (S) เขียนสำหรับชุดของการนับจำนวน จำกัด เฉพาะที่บน S และNสำหรับพีชคณิต smallest ที่เล็กที่สุดในNที่แสดงผลทุกจุดนับ ... วัดได้NN\mathfrak{N}NN\mathcal{N}NN\mathfrak{N} สำหรับฉันแล้วมันไม่มีความหมาย คำอธิบายในบริบททางวิศวกรรมเป็นที่เข้าใจมากขึ้นสำหรับฉัน ความคิดเห็น:ส่วนใหญ่ฉันพบว่าคำอธิบายของ Wikipedia ไร้ประโยชน์เนื่องจากข้อความที่ซับซ้อนคล้ายกัน(อย่างน้อยสำหรับฉัน) จากประสบการณ์ของฉันมีหนังสืออ้างอิงเพียงสองประเภทสำหรับสถิติ: a)ง่ายมากข)ซับซ้อนมาก! การอ่านทั้งคู่ไม่มีประโยชน์สำหรับฉันเลย! คำถาม: คุณมีทางออกสำหรับปัญหานี้หรือไม่? หรือประสบการณ์ที่คล้ายกัน? สำหรับผู้ที่พบว่าโพสต์นี้มีประโยชน์มีประโยชน์ในการตรวจสอบด้วย: การอ้างอิงสำหรับการให้คำปรึกษานักสถิติเพื่อให้ลูกค้าซึ่งกล่าวถึงหัวข้อที่เกี่ยวข้องจากมุมมองที่แตกต่างกัน

4
สมมติฐานการกระจายตัวแบบตกค้าง
ทำไมจึงจำเป็นต้องวางสมมุติฐานการกระจายในข้อผิดพลาดเช่น yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i}กับϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) ) ทำไมไม่เขียน yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i}กับyi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) , ที่ว่าในกรณีใดϵi=yi−y^ϵi=yi−y^\epsilon_i = y_i - \hat{y} Y ฉันเคยเห็นมันเน้นว่าข้อสันนิษฐานของการกระจายสินค้าถูกวางไว้บนข้อผิดพลาดไม่ใช่ข้อมูล แต่ไม่มีคำอธิบาย ฉันไม่เข้าใจความแตกต่างระหว่างสูตรทั้งสองนี้จริงๆ บางแห่งที่ฉันเห็นสมมติฐานการกระจายถูกวางไว้บนข้อมูล (Bayesian lit. ดูเหมือนว่าส่วนใหญ่) แต่เวลาส่วนใหญ่ข้อสันนิษฐานที่วางอยู่บนข้อผิดพลาด เมื่อสร้างแบบจำลองทำไม / ควรเลือกที่จะเริ่มต้นด้วยสมมติฐานหนึ่งหรืออื่น ๆ ?

3
เปลี่ยนจากการใช้ซอฟต์แวร์ทางสถิติเพื่อทำความเข้าใจสมการทางคณิตศาสตร์หรือไม่
บริบท: ฉันเป็นนักศึกษาปริญญาเอกด้านจิตวิทยา เช่นเดียวกับนักศึกษาปริญญาเอกจิตวิทยาหลายคนฉันรู้วิธีการวิเคราะห์ทางสถิติต่าง ๆ โดยใช้ซอฟต์แวร์ทางสถิติจนถึงเทคนิคต่าง ๆ เช่น PCA การจำแนกต้นไม้และการวิเคราะห์กลุ่ม แต่ก็ไม่เป็นที่น่าพอใจเพราะแม้ว่าฉันสามารถอธิบายได้ว่าทำไมฉันถึงวิเคราะห์และตัวบ่งชี้ความหมายฉันไม่สามารถอธิบายได้ว่าเทคนิคทำงานอย่างไร ปัญหาที่แท้จริงคือซอฟต์แวร์ทางสถิติที่เข้าใจง่าย แต่มีข้อ จำกัด ในการเรียนรู้เทคนิคใหม่ในบทความนั้นฉันต้องเข้าใจวิธีการอ่านสมการทางคณิตศาสตร์ ในปัจจุบันฉันไม่สามารถคำนวณค่าลักษณะเฉพาะหรือค่า K สมการเป็นเหมือนภาษาต่างประเทศสำหรับฉัน คำถาม: มีคำแนะนำที่ครอบคลุมที่ช่วยในการทำความเข้าใจสมการในบทความวารสารหรือไม่? แก้ไข: ฉันคิดว่าคำถามนั้นจะอธิบายได้ด้วยตนเองมากกว่า: เหนือความซับซ้อนบางอย่างสัญกรณ์ทางสถิติกลายเป็นคำพูดพล่อยๆสำหรับฉัน; สมมติว่าฉันต้องการโค้ดฟังก์ชั่นของตัวเองใน R หรือ C ++ เพื่อทำความเข้าใจกับเทคนิค แต่มีสิ่งกีดขวาง ฉันไม่สามารถแปลงสมการเป็นโปรแกรม และจริง ๆ : ฉันไม่รู้สถานการณ์ในโรงเรียนปริญญาเอกของสหรัฐอเมริกา แต่ในเหมือง (ฝรั่งเศส) หลักสูตรเดียวที่ฉันสามารถติดตามได้คือการเคลื่อนไหวเกี่ยวกับครอกศตวรรษที่ 16 ...

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.