สถิติและข้อมูลขนาดใหญ่

ถามตอบสำหรับผู้ที่สนใจในสถิติการเรียนรู้ของเครื่องจักรการวิเคราะห์ข้อมูลการขุดข้อมูล

2
การแปลงกลับของสัมประสิทธิ์การถดถอย
ฉันกำลังถดถอยเชิงเส้นด้วยตัวแปรที่ขึ้นกับการแปลง การเปลี่ยนแปลงต่อไปนี้ได้ทำขึ้นเพื่อให้สมมติฐานเกี่ยวกับความเป็นปกติของเศษซากเหลืออยู่ ตัวแปรที่ขึ้นต่อกันที่ไม่ถูกแปลงนั้นมีความเบ้เชิงลบและการแปลงต่อไปนี้ทำให้ใกล้เคียงปกติ: Y=50−Yorig−−−−−−−−√Y=50−YorigY=\sqrt{50-Y_{orig}} โดยที่YorigYorigY_{orig}เป็นตัวแปรตามในระดับเดิม ฉันคิดว่ามันทำให้ความรู้สึกที่จะใช้การเปลี่ยนแปลงบางอย่างเกี่ยวกับββ\betaค่าสัมประสิทธิ์การทำงานทางด้านหลังของเราขนาดเดิม ใช้สมการถดถอยต่อไปนี้ Y=50−Yorig−−−−−−−−√=α+β⋅XY=50−Yorig=α+β⋅XY=\sqrt{50-Y_{orig}}=\alpha+\beta \cdot X และโดยการแก้ไขเรามีX=0X=0X=0 α=50−Yorig−−−−−−−−√=50−αorig−−−−−−−−√α=50−Yorig=50−αorig\alpha=\sqrt{50-Y_{orig}}=\sqrt{50-\alpha_{orig}} และในที่สุดก็, αorig=50−α2αorig=50−α2\alpha_{orig}=50-\alpha^2 ใช้ตรรกะเดียวกันฉันพบ βorig=α (α−2β)+β2+αorig−50βorig=α (α−2β)+β2+αorig−50\beta_{orig}=\alpha\space(\alpha-2\beta)+\beta^2+\alpha_{orig}-50 ตอนนี้ทุกอย่างทำงานได้ดีสำหรับแบบจำลองที่มีตัวทำนาย 1 หรือ 2 ตัว ค่าสัมประสิทธิ์การแปลงกลับคล้ายกับค่าเดิมตอนนี้ฉันสามารถเชื่อถือข้อผิดพลาดมาตรฐานได้แล้ว ปัญหาเกิดขึ้นเมื่อมีคำศัพท์โต้ตอบเช่น Y=α+X1βX1+X2βX2+X1X2βX1X2Y=α+X1βX1+X2βX2+X1X2βX1X2Y=\alpha+X_1\beta_{X_1}+X_2\beta_{X_2}+X_1X_2\beta_{X_1X_2} จากนั้นการเปลี่ยนรูปแบบกลับสำหรับนั้นไม่ใกล้เคียงกับระดับเดิมและฉันไม่แน่ใจว่าทำไมจึงเกิดขึ้น ฉันไม่แน่ใจเช่นกันว่าสูตรที่พบสำหรับการเปลี่ยนค่าสัมประสิทธิ์เบต้าสามารถใช้งานได้เช่นเดียวกับที่ 3 β (สำหรับเงื่อนไขการโต้ตอบ) ก่อนเข้าสู่พีชคณิตบ้าฉันคิดว่าฉันจะขอคำแนะนำ ...ββ\betaββ\beta

1
วิธีการเลือกระหว่าง ANOVA และ ANCOVA ในการทดลองออกแบบ?
ฉันกำลังทำการทดลองซึ่งมีสิ่งต่อไปนี้: DV: ปริมาณการใช้ชิ้น (ต่อเนื่องหรืออาจจัดเป็นหมวดหมู่) IV: ข้อความเพื่อสุขภาพ, ข้อความที่ไม่แข็งแรง, ไม่มีข้อความ (กลุ่มควบคุม) (3 กลุ่มที่ผู้คนได้รับมอบหมายแบบสุ่ม - หมวดหมู่) นี่คือข้อความที่จัดการเกี่ยวกับความสมบูรณ์ของชิ้น ตัวแปร IV ต่อไปนี้ถือได้ว่าเป็นตัวแปรที่แตกต่างของแต่ละบุคคล: Impulsivity (ซึ่งอาจเป็นหมวดหมู่เช่น. สูงเทียบกับต่ำหรือต่อเนื่องและวัดโดยขนาด) การตั้งค่ารสหวาน (นอกจากนี้ยังวัดโดยแบบสอบถามซึ่งมี 3 ตัวเลือกให้เลือกสำหรับแต่ละคำถาม) ค่าดัชนีมวลกาย - ผู้เข้าร่วมจะได้รับการชั่งน้ำหนักวัดตาม (ซึ่งอาจพิจารณาได้ทั้งหมวดหมู่หรือต่อเนื่อง) เนื่องจากกลุ่มจะได้รับการสุ่มให้เป็นหนึ่งใน 3 กลุ่มฉันคิดว่าฉันกำลังทำ ANOVA บางประเภทและอาจใช้ Factorial ANOVA เนื่องจากฉันสนใจว่า IV มีผลต่อ DV มากที่สุด แต่ยังมีปฏิสัมพันธ์ระหว่าง IV ด้วยเช่นกัน มีความสัมพันธ์ระหว่างชุดค่าผสมบางอย่าง แต่ฉันไม่แน่ใจในเรื่องนี้อย่างสมบูรณ์เนื่องจากต้องการทราบว่าเป็นการดีที่สุดหรือไม่ที่จะให้ IV มีหมวดหมู่ทั้งหมดหรือต่อเนื่องหรือผสมกัน หรือ ANCOVA เป็นไปได้หรือแม้กระทั่งการถดถอย …

1
เหตุใดเราจึงคิดว่าข้อผิดพลาดนั้นกระจายตามปกติ
ฉันสงสัยว่าทำไมเราจึงใช้สมมติฐาน Gaussian เมื่อทำแบบจำลองข้อผิดพลาด ในหลักสูตร ML ของสแตนฟอร์ดศาสตราจารย์อึ้งได้อธิบายถึงมารยาทสองประการ: มันสะดวกในเชิงคณิตศาสตร์ (มันเกี่ยวข้องกับ Least Squares ที่เหมาะสมและง่ายต่อการแก้ไขด้วย pseudoinverse) เนื่องจากทฤษฎีบทขีด จำกัด กลางเราอาจสันนิษฐานว่ามีข้อเท็จจริงพื้นฐานมากมายที่ส่งผลกระทบต่อกระบวนการและผลรวมของข้อผิดพลาดส่วนบุคคลเหล่านี้จะมีแนวโน้มที่จะทำงานเหมือนในการแจกแจงปกติแบบศูนย์ ในทางปฏิบัติดูเหมือนว่าจะเป็นเช่นนั้น ฉันสนใจส่วนที่สองจริง ๆ ทฤษฎีบทขีด จำกัด กลางใช้ได้กับตัวอย่าง iid เท่าที่ฉันรู้ แต่เราไม่สามารถรับประกันได้ว่าตัวอย่างต้นแบบจะเป็น iid คุณมีความคิดเห็นเกี่ยวกับข้อผิดพลาดของเกาส์เซียนหรือไม่?

5
วิธีการระบุการกระจาย lognormal ในการโต้แย้งตระกูล glm ใน R?
คำถามง่าย ๆ : จะระบุการกระจายแบบ lognormal ในอาร์กิวเมนต์ตระกูล GLM ใน R ได้อย่างไร? ฉันไม่สามารถค้นหาวิธีการนี้สามารถทำได้ เหตุใด lognormal (หรือ exponential) จึงไม่มีตัวเลือกในการโต้แย้งครอบครัว? ที่ไหนสักแห่งใน R-Archives ฉันอ่านว่ามีการใช้ log-link สำหรับครอบครัวที่ตั้งค่าเป็น gaussian ใน GLM เพื่อระบุ lognormal อย่างไรก็ตามนี่เป็นเรื่องไร้สาระเพราะมันจะพอดีกับการถดถอยเชิงเส้นและ R เริ่มขอค่าเริ่มต้น มีใครทราบวิธีตั้งค่าการกระจาย lognormal (หรือเลขชี้กำลัง) สำหรับ GLM หรือไม่

1
อนุสัญญาสัญกรณ์สำหรับตัวแปรสุ่มและการแจกแจง
ฉันสับสนในความหมายที่เหมาะสมของความหมายรวมถึงความหมายของสัญลักษณ์บางอย่างที่เกี่ยวข้องกับตัวแปรสุ่มและการแจกแจง ด้านล่างนี้ฉันจะเขียนรายการสิ่งที่ฉันคิดว่าเป็นจริงรวมถึงสิ่งที่ฉันไม่เข้าใจและฉันจะรักการแก้ไข / การแก้ไข ฉันติดป้ายแต่ละจุด / คำถามด้วยหมายเลขเพื่อความสะดวกในการอ้างอิง ถ้ามันไม่เหมาะสมที่จะแสดงรายการในคำถามเดียวเช่นนี้โปรดแจ้งให้เราทราบ ฉันคิดว่ามันคงจะโอเคเพราะมันสั้น ตัวแปรสุ่ม notated โดยอักษรตัวใหญ่เช่นXXXX การดำเนินการกับตัวแปรสุ่มหมายถึงอะไร (เช่นคุณแปลความหมายคำได้อย่างไร)X2X2X^2 การดึงที่เฉพาะเจาะจงจากตัวแปรสุ่มจะได้รับการแจ้งโดยตัวอักษรตัวเล็ก (เช่น ) หรือตัวอักษรตัวเล็กที่มีตัวห้อย (เช่น ) หรือตัวเลขตัวพิมพ์ใหญ่ที่มีตัวเลข (เช่น )x 1 X 1xxxx1x1x_1X1X1X_1 ตัวแปรสุ่มที่เป็นสถิติคำสั่งของดึงออกมาจากตัวแปรสุ่มเป็น notated เป็น{}n X X k nkthkthkthnnnXXXXknXknX_{kn} มีวิธีการจดชวเลข "X คือตัวแปรสุ่มที่กระจายโดย F (x) (หรือ" cdf F (x) "หรือ" B (a, b) "หรือวิธีใด ๆ ที่แสดงลักษณะการแจกแจง)" ฉันสามารถเขียนเพื่อหมายถึงความคาดหวังของตัวแปรที่กระจายตามหรือไม่F …

3
เหมาะสมหลายตัวแปรลูกบาศก์ธรรมชาติ
หมายเหตุ: หากไม่มีคำตอบที่ถูกต้องหลังจากผ่านไปหนึ่งเดือนฉันได้โพสต์ข้อความใหม่เป็นSO พื้นหลัง ฉันมีแบบจำลองที่Y = f ( X )fffY=f(X)Y=f(X)Y=f(\textbf{X}) คือเมทริกซ์ n × mของตัวอย่างจากพารามิเตอร์ mและ Yคือ n × 1XX\textbf{X}n×mn×mn \times mmmmYYYn×1n×1n \times 1เวกเตอร์ของเอาต์พุตโมเดล มีการคำนวณอย่างเข้มข้นดังนั้นฉันจึงต้องการประมาณ fโดยใช้ลูกบาศก์หลายตัวแปรผ่านจุด ( X , Y )เพื่อให้ฉันสามารถประเมิน Yที่จุดจำนวนมากffffff(X,Y)(X,Y)(X,Y)YYY คำถาม มีฟังก์ชั่น R ที่จะคำนวณความสัมพันธ์โดยพลการระหว่าง X และ Y หรือไม่? โดยเฉพาะฉันกำลังมองหารุ่นหลายตัวแปรของsplinefunฟังก์ชั่นซึ่งสร้างฟังก์ชั่น spline สำหรับกรณี univariate เช่นนี้เป็นวิธีการsplinefunทำงานสำหรับกรณี univariate x <- 1:10 y <- runif(10) …

2
การคำนวณเปอร์เซ็นต์ไทล์ 95: การเปรียบเทียบการแจกแจงแบบปกติ, R Quantile และ Excel
ฉันพยายามคำนวณเปอร์เซ็นต์ไทล์ไทล์ที่ 95 บนชุดข้อมูลต่อไปนี้ ฉันเจอการอ้างอิงทางออนไลน์ไม่กี่แห่ง วิธีที่ 1: อ้างอิงจากข้อมูลตัวอย่าง แรกบอกฉันจะได้รับTOP 95 Percentของชุดข้อมูลและจากนั้นเลือกMINหรือAVGของชุดผลลัพธ์ การทำเช่นนั้นสำหรับชุดข้อมูลต่อไปนี้ให้ฉัน: AVG: 29162 MIN: 0 วิธีที่ 2: สมมติว่าการแจกแจงแบบปกติ อันที่สองบอกว่าเปอร์เซ็นไทล์ที่ 95 นั้นประมาณสองส่วนเบี่ยงเบนมาตรฐานเหนือค่าเฉลี่ย (ซึ่งฉันเข้าใจ) และฉันแสดง: AVG(Column) + STDEV(Column)*1.65: 67128.542697973 วิธีที่ 3: R Quantile ฉันเคยRได้รับ 95 เปอร์เซ็นต์: > quantile(data$V1, 0.95) 79515.2 วิธีที่ 4: วิธีการของ Excel ในที่สุดฉันก็เจอสิ่งนี้ซึ่งอธิบายว่า Excel ทำได้อย่างไร สรุปวิธีการดังต่อไปนี้: รับชุดของNค่าที่สั่ง{v[1], v[2], ...}และข้อกำหนดในการคำนวณpthเปอร์เซ็นต์ไทล์ให้ทำดังต่อไปนี้: คำนวณ …
17 r  dataset  quantiles  sql 

5
สำหรับการจำแนกประเภทด้วยป่าสุ่มใน R เราควรปรับขนาดคลาสที่ไม่สมดุลได้อย่างไร
ฉันกำลังสำรวจวิธีการจำแนกประเภทที่แตกต่างกันสำหรับโครงการที่ฉันกำลังดำเนินการอยู่และสนใจลองใช้การสุ่มป่า ฉันพยายามที่จะให้การศึกษาตัวเองในขณะที่ฉันไปตามและจะขอบคุณความช่วยเหลือจากชุมชน CV ฉันแบ่งข้อมูลของฉันออกเป็นชุดฝึกอบรม / ทดสอบ จากการทดลองกับป่าสุ่มใน R (โดยใช้แพ็คเกจแบบสุ่มป่าไม้) ฉันมีปัญหากับอัตราการจำแนกผิดพลาดสูงสำหรับชั้นเรียนขนาดเล็กของฉัน ฉันได้อ่านบทความนี้เกี่ยวกับประสิทธิภาพของป่าสุ่มบนข้อมูลที่ไม่สมดุลและผู้เขียนเสนอวิธีการสองวิธีในการจัดการกับความไม่สมดุลของระดับเมื่อใช้ป่าสุ่ม 1. ป่าไม้แบบถ่วงน้ำหนัก 2. ป่าไม้แบบสมดุล แพคเกจ R ไม่อนุญาตให้มีน้ำหนักของคลาส (จากฟอรัมช่วยเหลือ R ฉันได้อ่านพารามิเตอร์ classwt ทำงานไม่ถูกต้องและกำหนดเวลาเป็นการแก้ไขข้อบกพร่องในอนาคต) ดังนั้นฉันจึงเหลือตัวเลือก 2 ฉันสามารถระบุได้ จำนวนวัตถุที่สุ่มตัวอย่างจากแต่ละคลาสสำหรับการวนซ้ำแต่ละครั้งของฟอเรสต์แบบสุ่ม ฉันรู้สึกไม่สบายใจเกี่ยวกับการตั้งค่าขนาดตัวอย่างที่เท่ากันสำหรับป่าแบบสุ่มเนื่องจากฉันรู้สึกว่าฉันจะสูญเสียข้อมูลมากเกินไปเกี่ยวกับชั้นเรียนขนาดใหญ่ที่นำไปสู่ประสิทธิภาพที่ไม่ดีกับข้อมูลในอนาคต อัตราการจำแนกประเภทเมื่อลดขนาดกลุ่มที่ใหญ่กว่าได้แสดงให้เห็นว่าดีขึ้น แต่ฉันสงสัยว่ามีวิธีอื่นในการจัดการกับขนาดชั้นเรียนที่ไม่สมดุลในป่าสุ่มหรือไม่

7
การถดถอยเชิงเส้นอย่างง่ายหมายความถึงสาเหตุหรือไม่?
ฉันรู้ว่าความสัมพันธ์ไม่ได้บ่งบอกถึงสาเหตุ แต่เป็นจุดแข็งและทิศทางของความสัมพันธ์ การถดถอยเชิงเส้นอย่างง่ายหมายความถึงสาเหตุหรือไม่? หรือการทดสอบสถิติเชิงอนุมาน (t-test ฯลฯ ) จำเป็นสำหรับสิ่งนั้นหรือไม่?

2
ฉันจะตีความ Exp (B) ในการถดถอยแบบ Cox ได้อย่างไร
ฉันเป็นนักศึกษาแพทย์ที่พยายามทำความเข้าใจกับสถิติ (!) - ดังนั้นขอให้สุภาพ! ;) ฉันกำลังเขียนเรียงความที่ประกอบด้วยการวิเคราะห์ทางสถิติในจำนวนที่เหมาะสมรวมถึงการวิเคราะห์การอยู่รอด (Kaplan-Meier, Log-Rank และ Cox regression) ฉันใช้ Cox regression กับข้อมูลของฉันพยายามค้นหาว่าฉันสามารถค้นหาความแตกต่างที่สำคัญระหว่างการเสียชีวิตของผู้ป่วยในสองกลุ่ม (ผู้ป่วยที่มีความเสี่ยงสูงหรือผู้ที่มีความเสี่ยงต่ำ) ฉันได้เพิ่ม covariates หลายตัวลงใน Cox regression เพื่อควบคุมอิทธิพลของพวกเขา Risk (Dichotomous) Gender (Dichotomous) Age at operation (Integer level) Artery occlusion (Dichotomous) Artery stenosis (Dichotomous) Shunt used in operation (Dichotomous) ฉันลบ Artery occlusion ออกจากรายการ covariates เนื่องจาก SE มีค่าสูงมาก …

5
วิธีการเพิ่มองค์ประกอบตามระยะเวลาในรูปแบบการถดถอยเชิงเส้น?
ฉันมีข้อมูลความถี่สะสม บรรทัดดูเหมือนว่าเหมาะกับข้อมูลที่ดีมาก แต่มีการวนรอบ / แบบกระดิกในบรรทัด ฉันต้องการที่จะประเมินเมื่อความถี่สะสมจะถึงค่าบางอย่างคเมื่อฉันพล็อตส่วนที่เหลือเทียบกับค่าติดตั้งฉันได้รับพฤติกรรมไซน์ที่สวยงามy=ax+by=ax+by=ax+bccc ตอนนี้เพื่อเพิ่มความซับซ้อนอื่นให้ทราบว่าในแปลงที่เหลือ มีสองรอบที่มีค่าต่ำกว่ารอบอื่น ๆ ซึ่งหมายถึงเอฟเฟกต์สุดสัปดาห์ที่ต้องนำมาพิจารณาด้วย ดังนั้นฉันจะไปจากที่นี่ที่ไหน ฉันจะรวมคำโคไซน์ไซน์หรือไซโคลเข้ากับตัวแบบการถดถอยได้อย่างไร ประมาณการเมื่อความถี่สะสมจะเท่ากับ ?ccc

1
การใช้ HMM ในด้านการเงินเชิงปริมาณ ตัวอย่างของ HMM ที่ทำงานเพื่อตรวจจับเทรนด์ / จุดเปลี่ยน?
ฉันกำลังค้นหาโลกมหัศจรรย์ของ "Hidden Markov Models" ที่เรียกว่า "ระบอบการปกครองแบบจำลองการสลับ" ฉันต้องการปรับ HMM ใน R เพื่อตรวจหาแนวโน้มและจุดเปลี่ยน ฉันต้องการสร้างแบบจำลองทั่วไปให้ได้มากที่สุดเพื่อให้สามารถทดสอบได้ในหลาย ๆ ราคา ใครช่วยแนะนำกระดาษได้บ้าง ฉันได้เห็น (และอ่าน) (มากกว่า) น้อย แต่ฉันกำลังมองหารูปแบบเรียบง่ายที่ใช้งานง่าย ยังแนะนำแพ็คเกจ R อะไรอีกบ้าง? ฉันเห็นว่ามีคนจำนวนมากกำลังทำอืม ฉันซื้อหนังสือ "Hidden Markov models สำหรับซีรี่ส์เวลา: บทนำโดยใช้ R" มาดูกันว่ามีอะไรอยู่ในนั้น;) เฟร็ด

4
ข้อดีและข้อเสียของการใช้ logrank กับวิธี Mantel-Haenszel สำหรับการคำนวณอัตราส่วนความเป็นอันตรายในการวิเคราะห์การอยู่รอดคืออะไร
วิธีหนึ่งในการสรุปการเปรียบเทียบเส้นโค้งการอยู่รอดสองเส้นคือการคำนวณอัตราส่วนความเป็นอันตราย (HR) มีอย่างน้อยสองวิธีในการคำนวณค่านี้ วิธีการ Logrank เป็นส่วนหนึ่งของการคำนวณ Kaplan-Meier ให้คำนวณจำนวนของเหตุการณ์ที่สังเกต (ตายโดยปกติ) ในแต่ละกลุ่ม ( และO b ) และจำนวนของเหตุการณ์ที่คาดหวังซึ่งสมมติว่าสมมติฐานว่างจากการอยู่รอดไม่แตกต่างกัน ( E aและE b ) อัตราส่วนความเป็นอันตรายนั้นคือ: H R = ( O a / E a )OaOaOaObObObEaEaEaEbEbEbHR=(Oa/Ea)(Ob/Eb)HR=(Oa/Ea)(Ob/Eb) HR= \frac{(Oa/Ea)}{(Ob/Eb)} HR=exp((Oa−Ea)V)HR=exp⁡((Oa−Ea)V) HR= \exp\left(\frac{(Oa-Ea)}{V}\right) มีคนส่งตัวอย่างที่ทั้งสองวิธีแตกต่างกันโดยปัจจัยที่สาม ในตัวอย่างนี้เป็นที่ชัดเจนว่าการประมาณ logrank นั้นสมเหตุสมผลและการประมาณการ Mantel-Haenszel นั้นอยู่ไกลมาก คำถามของฉันคือถ้าใครมีคำแนะนำทั่วไปสำหรับเมื่อมันเป็นการดีที่สุดที่จะเลือกการประมาณ logrank ของอัตราส่วนความเป็นอันตรายและเมื่อมันจะดีที่สุดในการเลือกประมาณการ Mantel-Haenszel? มันต้องทำกับขนาดตัวอย่างหรือไม่? จำนวนความสัมพันธ์? อัตราส่วนขนาดตัวอย่าง?
17 survival  hazard 

2
ทำความเข้าใจเกี่ยวกับการทดสอบ t สำหรับการถดถอยเชิงเส้น
ฉันกำลังพยายามหาวิธีการทดสอบสมมติฐานบางอย่างเกี่ยวกับการถดถอยเชิงเส้น (สมมติฐานว่างไม่มีความสัมพันธ์) ทุกคำแนะนำและหน้าในเรื่องที่ฉันพบดูเหมือนจะใช้การทดสอบ t แต่ฉันไม่เข้าใจความหมายของการทดสอบการถดถอยเชิงเส้น การทดสอบแบบทียกเว้นว่าฉันมีความเข้าใจผิดอย่างสมบูรณ์หรือแบบจำลองทางจิตถูกใช้เพื่อเปรียบเทียบประชากรสองคน แต่ regressor และ regressand ไม่ใช่ตัวอย่างของประชากรที่คล้ายกันและอาจไม่ได้เป็นหน่วยเดียวกันดังนั้นจึงไม่มีเหตุผลที่จะเปรียบเทียบมัน ดังนั้นเมื่อใช้ t-test ในการถดถอยเชิงเส้นสิ่งที่เราทำจริง ๆ ?

1
การเลือกระหว่างนักบวชเบต้ารุ่นใหม่
ฉันกำลังมองหานักบวชที่ไม่รู้เรื่องสำหรับการแจกแจงเบต้าเพื่อทำงานกับกระบวนการทวินาม (Hit / Miss) ในตอนแรกที่ผมคิดเกี่ยวกับการใช้α = 1,β= 1α=1,β=1\alpha=1, \beta=1ที่สร้างเครื่องแบบ PDF, หรือเจฟฟรีย์ก่อนα = 0.5,β= 0.5α=0.5,β=0.5\alpha=0.5, \beta=0.5 0.5 แต่ฉันกำลังมองหาจริงไพรเออร์ที่มีผลกระทบน้อยที่สุดกับผลหลังและจากนั้นผมคิดเกี่ยวกับการใช้งานที่ไม่เหมาะสมก่อนα=0,β=0α=0,β=0\alpha=0, \beta=0 0 ปัญหาตรงนี้คือการกระจายตัวด้านหลังของฉันใช้งานได้ก็ต่อเมื่อฉันมีเพลงฮิตอย่างน้อยหนึ่งเพลง เพื่อเอาชนะสิ่งนี้ฉันจึงคิดถึงการใช้ค่าคงที่ที่น้อยมากเช่นα=0.0001,β=0.0001α=0.0001,β=0.0001\alpha=0.0001, \beta=0.0001เพียงเพื่อให้มั่นใจว่าหลังαα\alphaและββ\betaจะ0>0>0>0 ไม่มีใครรู้ว่าวิธีนี้เป็นที่ยอมรับ? ฉันเห็นเอฟเฟ็กต์ตัวเลขของการเปลี่ยนแปลงก่อนหน้านี้ แต่มีบางคนให้การแปลความหมายของการใส่ค่าคงที่ขนาดเล็กเช่นนี้ในฐานะนักบวช?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.