ในสถิติฉันควรถือว่าการ


18

ฉันกำลังศึกษาสถิติและมักพบสูตรที่มีlogและฉันมักสับสนถ้าฉันควรตีความว่าเป็นความหมายมาตรฐานของlogเช่นฐาน 10 หรือในสถิติสัญลักษณ์log มักจะถือว่าเป็นบันทึกธรรมชาติlnสันนิษฐานโดยทั่วไปจะบันทึกของธรรมชาติ

โดยเฉพาะอย่างยิ่งฉันกำลังศึกษาการประมาณค่าความถี่ที่ดีของทัวริงเป็นตัวอย่าง แต่คำถามของฉันเป็นคำถามทั่วไปมากกว่า


2
"สำหรับหลาย ๆ แอปพลิเคชันลอการิทึมธรรมชาติของฟังก์ชันความน่าจะเป็นที่เรียกว่าล็อก - โอกาสจะสะดวกในการทำงานด้วย" en.wikipedia.org/wiki/Likelihood_function#Log-likelihood ในสถิติที่เรามักจะทำงานกับฟังก์ชั่นความน่าจะเป็นมักจะเป็นสิ่งlnที่ได้รับการพิจารณา อย่างไรก็ตามทั้งสองมีความเกี่ยวข้อง: log(x) = ln(x) / ln(10) = ln(x) / 2.303, และฟังก์ชั่นln -likelihood มาถึงจุดสุดยอดในจุดเดียวกันกับฟังก์ชั่นlog10 -likelihood
John_West

5
ในพื้นที่ไม่กี่โปรแกรมเฉพาะเมื่อlogที่ถูกกล่าวถึงฐาน 10 มีจุดมุ่งหมาย แต่เป็น Aksakal บ่งชี้มิฉะนั้นก็ประชุมที่ใช้ในวิชาคณิตศาสตร์ - ที่ตกแต่งlogวิธีการบันทึกธรรมชาติ
Glen_b -Reinstate Monica

2
@John_West บอกว่าln(x)และloga(x)เหมือนกันกับปัจจัยการปรับสเกล ดังนั้นมันจึงเป็นสิ่งเดียวที่คุณวัดในหน่วยอื่น

1
@Aksakal; สิ่งที่คุณพูดมาเพื่อบอกว่าหน่วยมีความสำคัญ (ดูความคิดเห็นของฉัน supra) ซึ่งฉันเห็นด้วยกับ ฉันยังเขียนเพื่อระบุฐานอย่างชัดเจน สำหรับแอปพลิเคชัน (บางส่วน) ในสถิติเช่นโอกาสสูงสุดปัจจัยการปรับขนาดนี้ไม่เกี่ยวข้อง ค่าสูงสุดจะไม่เปลี่ยนแปลงหลังจากเพิ่มตัวคูณมาตราส่วน ในการอ้างอิงของ OP (good-turing ... ) พวกเขาต้องการพล็อตl o g ( N r ) (หรือl o g ( Z r ) ) เทียบกับl o g ( r )logalog(Nr)log(Zr)log(r). ซึ่งหมายความว่าหน่วยจะเปลี่ยนทั้งสองแกนของพล็อตดังนั้น '' โค้ง '' ที่ลงจุดไม่เปลี่ยนแปลง

1
เว้นเสียแต่ว่าคุณกำลังเขียนบทความแม้เมื่อใช้โอกาสในการบันทึกมาตราส่วน (ฐานลอการิทึม) มักเป็นเรื่องสำคัญ ตัวอย่างเช่นสถิติการทดสอบอัตราส่วนความน่าจะเป็นของบันทึกใช้คุณต้องปรับจากฐานอื่นเพื่อใช้ค่าวิกฤต หากคุณกำลังเขียนซอฟต์แวร์สิ่งสำคัญคือการได้รับสิทธิ์เมื่อใช้ฟังก์ชั่นโอกาสในการบันทึกจากเอกสาร ฯลฯ มีหลายกรณีที่ฐานสำคัญต่อการระบุว่าไม่สำคัญ ln
Aksakal

คำตอบ:


20

มันปลอดภัยที่จะสมมติว่าไม่มีฐานอย่างชัดเจน= lnในสถิติเนื่องจากบันทึกฐาน 10 ไม่ได้ใช้บ่อยในสถิติ อย่างไรก็ตามผู้โพสต์คนอื่น ๆ นำเสนอประเด็นที่บันทึก10หรือฐานอื่น ๆ สามารถพบได้ทั่วไปในบางสาขาที่มีการใช้สถิติเช่นทฤษฎีสารสนเทศ ดังนั้นเมื่อคุณอ่านเอกสารในสาขาอื่น ๆ มันจะทำให้สับสนในบางครั้งlog=lnlog10

วิกิพีเดียหน้าเอนโทรปีเป็นตัวอย่างที่ดีของความสับสนการใช้งานของการเข้าสู่ระบบในหน้าเดียวกันพวกเขาหมายถึงฐาน 2, eและฐานใด ๆ คุณสามารถเข้าใจบริบทที่มีความหมายได้ แต่ต้องอ่านข้อความ นี่ไม่ใช่วิธีที่ดีในการนำเสนอเนื้อหา เปรียบเทียบกับหน้าลอการิทึมที่ฐานแสดงชัดเจนในทุกสูตรหรือlnถูกใช้ โดยส่วนตัวฉันคิดว่านี่เป็นวิธีที่จะไป: แสดงฐานเสมอเมื่อมีการใช้สัญลักษณ์บันทึก นี่จะเป็นไปตามมาตรฐาน ISOสำหรับมาตรฐานไม่ได้กำหนดการใช้งานฐานที่ไม่ระบุพร้อมบันทึกlogelnloglogสัญลักษณ์ตามที่ @Henry ชี้ให้เห็น

ในที่สุดมาตรฐาน ISO 31-11กำหนดสัญญาณและlgสำหรับลอการิทึมฐาน 2 และ 10 ทั้งสองไม่ค่อยได้ใช้กันทุกวันนี้ ฉันจำได้ว่าเราใช้LGในโรงเรียนมัธยม แต่นั่นก็เป็นอีกศตวรรษหนึ่งในอีกโลกหนึ่ง ฉันไม่เคยเห็นมันมาตั้งแต่ใช้ในบริบททางสถิติ ไม่มีแม้แต่แท็กสำหรับlbใน LaTeXlbLGLGปอนด์


1
ลอการิทึมฐาน 2 นั้นค่อนข้างพบได้ทั่วไปในบางฟิลด์ บันทึกที่ไม่ได้ตกแต่งนั้นหาได้จากฐาน 10 แต่ก็ไม่ใช่ฐานeเสมอไป
นิวเคลียร์วัง

มีประโยชน์ แต่ฉันคิดว่า "ไม่ค่อย" แข็งแกร่งเกินไป มีฟิลด์สำคัญที่ผู้คนอาจรู้เพียงหรือเกี่ยวกับที่ดีที่สุดรู้สึกคุ้นเคยกับฐาน 10 ลอการิทึม โปรดทราบว่ากราฟจำนวนมากแสดงสเกลลอการิทึมโดยใช้พลัง 10 คนที่เลือกลอการิทึมธรรมชาติไม่พบความยากในการถอดรหัสสเกลดังกล่าว แต่ข้อสันนิษฐานของฐาน 10
นิคค็อกซ์

@NickCox, OP ระบุว่า "สถิติ" เป็นฟิลด์โดยเฉพาะและฉันไม่เห็นลอการิทึมฐาน 10 ที่ใช้ในสถิติบ่อยครั้ง
Aksakal

ดูเหมือนว่า ISO 31-11 จะระบุสำหรับบันทึกeและไม่ได้ใส่บันทึกที่ยังไม่ได้ตกแต่งlnlogelog
เฮนรี่

1
@NickCox ฉันทำให้ภาษาอ่อนลงคุณพูดถึงจุดที่เป็นธรรม
Aksakal

14

มันขึ้นอยู่กับ.

นอกเหนือจากบริบทไม่กี่อย่างเช่นการแปลงค่าเป็นเดซิเบลลอการิทึมฐาน 10 นั้นค่อนข้างหายากในสมการ อย่างไรก็ตามพล็อตการบันทึกระดับมักจะอยู่ในฐาน -10 แม้ว่ามันจะค่อนข้างง่ายต่อการตรวจสอบจากฉลากบนแกน

ในบริบททางคณิตศาสตร์ไม่มีการตกแต่งมีแนวโน้มว่าจะเป็นบันทึกธรรมชาติ (เช่นล็อกeหรือln ) ในทางกลับกันวิทยาการคอมพิวเตอร์มักใช้ลอการิทึมฐาน 2 ( บันทึก2 ) และพวกเขาไม่ได้ทำเครื่องหมายอย่างชัดเจนเสมอเช่นนี้ ข่าวดีก็คือคุณสามารถแปลงระหว่างฐานเล็กน้อยและใช้ฐาน "ผิด" จะทำให้คำตอบของคุณโดยปัจจัยคงที่เท่านั้นloglogelnlog2

ใน Gale's 1995 "Good-Turing Without Tears"กระดาษลอการิทึมในข้อความจริงคือ (มันบอกอย่างนั้นในหน้า 5) แต่รหัส R / S + ในภาคผนวกใช้ฟังก์ชั่นซึ่งจริงๆแล้วบันทึกeหรือlnlog10loglogeln . @Henry ชี้ให้เห็นด้านล่างสิ่งนี้ทำให้ไม่มีความแตกต่างในทางปฏิบัติ

หากฉันถูกบังคับให้ต้องเดานี่คือฮิวริสติก:

  • หากกำลังของ 2, หรือ 10 ยังปรากฏอยู่ล็อกมีแนวโน้มที่จะมีฐานที่สอดคล้องกันe

  • หากเกิดจากการรวม (หรือโดยทั่วไปเกี่ยวข้องกับแคลคูลัส) ก็น่าจะเป็นบันทึกธรรมชาติ1/x

  • ถ้ามันเกิดขึ้นซ้ำแล้วซ้ำอีกจากการหารบางสิ่งบางอย่างในช่วงครึ่งปี (ในขณะที่ค้นหา binary) ก็มีแนวโน้มที่จะ 2 โดยทั่วไปสิ่งที่สามารถหารด้วยnประมาณlog nครั้งlog2nlogn

  • การคำนวณข้อมูลเชิงทฤษฎีมักใช้โดยเฉพาะในงานสมัยใหม่ อย่างไรก็ตามคุณสามารถตรวจสอบหน่วยเพื่อให้แน่ใจว่า: บิตเข้าสู่ระบบ2 , NATSLNและเรย์แบนเข้าสู่ระบบ 10log2bitslog2natslnbanslog10

  • ค้นหาจุดที่ฟังก์ชันตกหรือเพิ่มขึ้นเป็น , (37% และ 63% ตามลำดับ) ของค่าเริ่มต้นแนะนำบันทึกธรรมชาติ1e or 11e


5
+1 เคล็ดลับเล็ก ๆ คือถ้าพบ exponentials ใกล้เคียงลอการิทึมธรรมชาติมีแนวโน้มและตรงกันข้ามกับพลังของ 10 หรือ 2 หากฐานที่ถูกใช้ยังไม่ชัดเจนพยายามทำซ้ำการคำนวณตัวอย่างของผู้เขียน exp()
Nick Cox

2
เนื่องจากกราฟในหน้า 6 และ 7 ของกระดาษของ Gale แสดงหน่วยดั้งเดิมบนมาตราส่วนการบันทึกและการคำนวณจะมุ่งไปที่ความลาดชันของความสัมพันธ์บันทึกการใช้งานคือในนิพจน์บันทึก( N r ) = a + b บันทึก( r )ซึ่งสอดคล้องกับN r = A r bมันไม่ทำให้เกิดความแตกต่างในทางปฏิบัติในกรณีนี้blog(Nr)=a+blog(r)Nr=Arb
Henry

2
ตัวอย่างของอีกคือเมื่อ platting ข้อมูลการลงทุนในตลาดหุ้นเมื่อใช้ราคาล็อกแกนเป็นเสมอฐาน 10base10
มาร์คัส D

3

ในการตอบคำถามของคุณ: ไม่คุณไม่สามารถถือว่าสัญลักษณ์ทั่วไปคงที่สำหรับลอการิทึม

คำถามที่คล้ายกันถูกอภิปรายเมื่อเร็ว ๆ นี้ในSE.Math: อะไรคือความแตกต่างระหว่างลอการิทึมทั้งสามประเภท? จากมุมมองทางคณิตศาสตร์ โดยทั่วไปมีสัญลักษณ์ต่าง ๆ ที่ขึ้นอยู่กับนิสัย ( ดูเหมือนว่าจะใช้ในการวิจัยทางการแพทย์ ) หรือภาษา (ตัวอย่างเช่นในเยอรมัน, รัสเซีย, ฝรั่งเศส) แต่น่าเสียดายที่สัญกรณ์เดียวกันบางครั้งก็จบลงด้วยการเป็นตัวแทนของคำนิยามที่แตกต่างกัน ข้อความจากลิงค์ SE.Math ด้านบน:log10

โน้ต (เกือบ) ไม่น่าสงสัยหมายถึงธรรมชาติลอการิทึม เข้าสู่ระบบE x (ละติน: logarithmus ตามธรรมชาติ) หรือลอการิทึมฐานอี สัญกรณ์บันทึกxควรเป็นสัญลักษณ์ที่ใช้สำหรับลอการิทึมธรรมชาติและเป็นเช่นนั้นในวิชาคณิตศาสตร์ แต่ก็มักจะหมายถึง "ธรรมชาติมากที่สุด" ขึ้นอยู่บนสนาม: ผมได้เรียนรู้ว่ามันเป็น base- * 10ลอการิทึม ( เข้าสู่ระบบ10 ) ที่โรงเรียนและมันมักจะใช้วิธีนี้ในงานวิศวกรรม (เช่นในความหมายของเดซิเบล) ที่lnxlogexelogx10log10

บ่อยครั้งถ้าคุณไม่เกี่ยวข้องกับความหมายของหน่วยทางกายภาพ (เช่นเดซิเบล @Matt Krause) และไม่สนใจอัตราการเปลี่ยนแปลงที่เฉพาะเจาะจง (ในชีวสถิติ -ratio สำหรับการเปลี่ยนแปลงแบบพับมักหมายถึงฐาน-2ลอการิทึมล็อก2 ) มีแนวโน้มว่าลอการิทึมธรรมชาติ ( log elog2log2loge )

ตัวอย่างเช่นในpower หรือ Box-Cox แปรรูป (สำหรับการรักษาความแปรปรวน), ลอการิทึมธรรมชาติจะปรากฏขึ้นเป็นขีด จำกัด เมื่อเลขชี้กำลังมีแนวโน้มเป็น0 0

กลับไปที่แรงจูงใจเริ่มต้นของคุณการประมาณความถี่ที่ดี - ทัวริงมันน่าสนใจที่จะอ่านความถี่ของประชากรของสปีชี่ส์และการประมาณค่าพารามิเตอร์ของประชากร IJ ดีไบโอเทรียก้า 2496 ที่นี่เขาใช้ลอการิทึมในบริบทต่าง ๆ เสถียรภาพความแปรปรวน (การกล่าวถึง Bartlett และ Anscombe), ผลรวมของอนุกรมฮาร์มอนิ, เอนโทรปี เราเห็นว่าเขามักใช้เป็นลอการิทึมธรรมชาติและนาน ๆ ครั้งในกระดาษจะระบุ log eหรือlog 10เมื่อบริบทต้องการ สำหรับการรักษาเสถียรภาพความแปรปรวนหรือการประมาณค่าเอนโทรปีพื้นฐานปัจจัยบนลอการิทึมไม่ได้เปลี่ยนแปลงผลลัพธ์มากเนื่องจากผลลัพธ์อนุญาตให้มีการเปลี่ยนแปลงเชิงเส้นloglogelog10


0

eln(L^)L^k

AIC=2(kln(L)).

ดังนั้นดูเหมือนว่าถ้าคุณใช้ฐานอื่นสำหรับลอการิทึมใน AIC คุณอาจท้ายวาดข้อสรุปที่ผิดและเลือกรูปแบบที่ไม่ถูกต้อง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.