อะไรคือเหตุผลที่อยู่เบื้องหลังสถิติการกำหนดดัชนีค่าดัชนีมวลกายเป็นน้ำหนัก / ส่วนสูง ?


10

บางทีคำถามนี้อาจมีคำตอบทางการแพทย์ แต่มีเหตุผลทางสถิติใดบ้างที่คำนวณดัชนี BMIเป็น ? ทำไมไม่ยกตัวอย่างเพียง ? ความคิดแรกของฉันคือมันมีส่วนเกี่ยวข้องกับการถดถอยแบบสมการกำลังสองweight/height2weight/height


ตัวอย่างข้อมูลจริง (200 คนที่มีน้ำหนักส่วนสูงอายุและเพศ):

structure(list(Age = c(18L, 21L, 17L, 20L, 19L, 53L, 27L, 22L, 
19L, 27L, 19L, 20L, 19L, 20L, 42L, 17L, 23L, 20L, 20L, 19L, 20L, 
19L, 19L, 18L, 19L, 15L, 19L, 15L, 19L, 21L, 60L, 19L, 17L, 23L, 
60L, 33L, 24L, 19L, 19L, 22L, 20L, 21L, 19L, 19L, 20L, 18L, 19L, 
20L, 22L, 20L, 20L, 27L, 19L, 22L, 19L, 20L, 20L, 21L, 16L, 19L, 
41L, 54L, 18L, 23L, 19L, 19L, 22L, 18L, 20L, 19L, 25L, 18L, 20L, 
15L, 61L, 19L, 34L, 15L, 19L, 16L, 19L, 18L, 15L, 20L, 20L, 20L, 
20L, 19L, 16L, 37L, 37L, 18L, 20L, 16L, 20L, 36L, 18L, 19L, 19L, 
20L, 18L, 17L, 22L, 17L, 22L, 16L, 24L, 17L, 33L, 17L, 17L, 15L, 
18L, 18L, 16L, 20L, 29L, 24L, 18L, 17L, 18L, 36L, 16L, 17L, 20L, 
16L, 43L, 19L, 18L, 20L, 19L, 18L, 21L, 19L, 20L, 23L, 19L, 19L, 
20L, 24L, 19L, 20L, 38L, 18L, 17L, 19L, 19L, 20L, 20L, 21L, 20L, 
20L, 42L, 17L, 20L, 25L, 20L, 21L, 21L, 22L, 19L, 25L, 19L, 40L, 
25L, 52L, 25L, 21L, 20L, 41L, 34L, 24L, 30L, 21L, 27L, 47L, 21L, 
16L, 31L, 21L, 37L, 20L, 22L, 19L, 20L, 25L, 23L, 20L, 20L, 21L, 
36L, 19L, 21L, 16L, 20L, 18L, 21L, 21L, 18L, 19L), Height = c(180L, 
175L, 178L, 160L, 172L, 172L, 180L, 165L, 160L, 187L, 165L, 176L, 
164L, 155L, 166L, 167L, 171L, 158L, 170L, 182L, 182L, 175L, 197L, 
170L, 165L, 176L, 167L, 170L, 168L, 163L, 155L, 152L, 158L, 165L, 
180L, 187L, 177L, 170L, 178L, 170L, 170L, NA, 188L, 180L, 161L, 
178L, 178L, 165L, 187L, 178L, 168L, 168L, 180L, 192L, 188L, 173L, 
193L, 184L, 167L, 177L, 177L, 160L, 167L, 190L, 187L, 163L, 173L, 
165L, 190L, 178L, 167L, 160L, 169L, 174L, 165L, 176L, 183L, 166L, 
178L, 158L, 180L, 167L, 170L, 170L, 180L, 184L, 170L, 180L, 169L, 
165L, 156L, 166L, 178L, 162L, 178L, 181L, 168L, 185L, 175L, 167L, 
193L, 160L, 171L, 182L, 165L, 174L, 169L, 185L, 173L, 170L, 182L, 
165L, 160L, 158L, 186L, 173L, 168L, 172L, 164L, 185L, 175L, 162L, 
182L, 170L, 187L, 169L, 178L, 189L, 166L, 161L, 180L, 185L, 179L, 
170L, 184L, 180L, 166L, 167L, 178L, 175L, 190L, 178L, 157L, 179L, 
180L, 168L, 164L, 187L, 174L, 176L, 170L, 170L, 168L, 158L, 175L, 
174L, 170L, 173L, 158L, 185L, 170L, 178L, 166L, 176L, 167L, 168L, 
169L, 168L, 178L, 183L, 166L, 165L, 160L, 176L, 186L, 162L, 172L, 
164L, 171L, 175L, 164L, 165L, 160L, 180L, 170L, 180L, 175L, 167L, 
165L, 168L, 176L, 166L, 164L, 165L, 180L, 173L, 168L, 177L, 167L, 
173L), Weight = c(60L, 63L, 70L, 46L, 60L, 68L, 80L, 68L, 55L, 
89L, 55L, 63L, 60L, 44L, 62L, 57L, 59L, 50L, 60L, 65L, 63L, 72L, 
96L, 50L, 55L, 53L, 54L, 49L, 72L, 49L, 75L, 47L, 57L, 70L, 105L, 
85L, 80L, 55L, 67L, 60L, 70L, NA, 76L, 85L, 53L, 69L, 74L, 50L, 
91L, 68L, 55L, 55L, 57L, 80L, 98L, 58L, 85L, 120L, 62L, 63L, 
88L, 80L, 57L, 90L, 83L, 51L, 52L, 65L, 92L, 58L, 76L, 53L, 64L, 
63L, 72L, 68L, 110L, 52L, 68L, 50L, 78L, 57L, 75L, 55L, 75L, 
68L, 60L, 65L, 48L, 56L, 65L, 65L, 88L, 55L, 68L, 74L, 65L, 62L, 
58L, 55L, 84L, 60L, 52L, 92L, 60L, 65L, 50L, 73L, 51L, 60L, 76L, 
48L, 50L, 53L, 63L, 68L, 56L, 68L, 60L, 70L, 65L, 52L, 75L, 65L, 
68L, 63L, 54L, 76L, 60L, 59L, 80L, 74L, 96L, 68L, 72L, 62L, 58L, 
50L, 75L, 70L, 85L, 67L, 65L, 55L, 78L, 58L, 53L, 56L, 72L, 62L, 
60L, 56L, 82L, 70L, 53L, 67L, 58L, 58L, 49L, 90L, 58L, 77L, 55L, 
70L, 64L, 98L, 60L, 60L, 65L, 74L, 99L, 49L, 47L, 75L, 77L, 74L, 
68L, 50L, 66L, 75L, 54L, 60L, 65L, 80L, 90L, 95L, 79L, 57L, 70L, 
60L, 85L, 44L, 58L, 50L, 88L, 60L, 54L, 68L, 56L, 69L), Gender = c(1L, 
1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 1L, 2L, 1L, 2L, 
2L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 
1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 
1L, 2L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 
2L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 
1L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 2L, 1L, 1L, 2L, 1L, 
1L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 1L, 1L, 2L, 
1L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 
2L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 
1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 
1L, 2L, 1L, 1L, 2L, 2L, 1L)), .Names = c("Age", "Height", "Weight", 
"Gender"), row.names = 304:503, class = "data.frame")

5
ทุกวันนี้สูตรเช่นนี้จะเลื่อนออกจากการถดถอยเชิงเส้นของล็อก (น้ำหนัก) เทียบกับล็อก (สูง) ซึ่ง (สำหรับเหตุผลทางชีววิทยาและสถิติ) เป็นวิธีที่เป็นธรรมชาติมากขึ้นในการวิเคราะห์ปริมาณเหล่านี้
whuber

8
ฉันหวังว่าจะแสดงข้อมูลนี้ด้วยข้อมูลจริง ครั้งแรกของ Google ตีพบได้ใน "ข้อมูลความสูงน้ำหนัก" ที่มีขนาดใหญ่ชุดยูซีแอลเป็นเจ้าภาพ มันปลอมอย่างชัดเจน! การแจกแจงร่อแร่มักจะกระจายอย่างสมบูรณ์แบบ (การทดสอบ SW ที่มีชุดย่อย 5,000 เกือบจะมีค่า p เกือบเสมอ 1/2): ไม่มีค่าผิดปกติไม่มีความผิดเพี้ยนต่ำ (จากส่วนผสมของเพศ) ไม่มีความเบ้ (จากส่วนผสมของอายุ) ข้อมูลเหล่านี้ถูกกล่าวหาว่า "ใช้เพื่อพัฒนา ... แผนภูมิการเติบโตของ ... ดัชนีมวลกาย (BMI) ของฮ่องกง" นั่นเป็นอย่างมากคาว
whuber

3
ขอบคุณ แต่ข้อมูลเหล่านั้นอาจถูก จำกัด เกินไปที่จะให้ความรู้สึกที่ดีว่าส่วนสูงและน้ำหนักแตกต่างกันอย่างไร อย่างน้อยพวกเขาจำเป็นต้องจำแนกตามเพศและอายุ เป็นที่ชัดเจนว่าลอการิทึมของความสูงและน้ำหนักดีกว่าในการวิเคราะห์: พวกเขาลดความแตกต่าง heteroscedasticity ซึ่ง @ttnphns หมายถึงและพวกเขายังช่วยทำให้การกระจายของส่วนที่เหลือสมมาตรมากขึ้น เป็นที่น่าสนใจว่าการถดถอยของน้ำหนักล็อกกับความสูงล็อกให้ความลาดชันของ0.28 ซึ่งเทียบได้กับประมาณการของ Quetelet ที่ประมาณ5/2 AdamO อ้างอิง 5 / 2 = 2.52.55±0.285/2=2.5
whuber

4
เปรียบเทียบlibrary(MASS); rlm(log(Weight) ~ log(Height) + cut(Age, 3) + as.factor(Gender), data=y)กับrlm(Weight ~ Height + cut(Age, 3) + as.factor(Gender), data=y)(และการวิเคราะห์พล็อตสำหรับทั้งสองแบบ) เพื่อดูผลลัพธ์ที่เป็นประโยชน์ของการใช้ลอการิทึม: แน่นอนว่าพวกมันมีเสถียรภาพและสมมาตรส่วนที่เหลือ ไม่ว่าในรูปแบบเพศใด ๆ ก็มีความสำคัญและอายุก็เช่นกัน ความสัมพันธ์กับอายุไม่เป็นเชิงเส้น เป็นที่น่าสนใจมากที่ค่าสัมประสิทธิ์ของการเข้าสู่ระบบ (สูง) ในรูปแบบแรกคือตอนนี้รอบแทน2.5( เป็นข้อมูลของคุณที่ลบค่าที่หายไป) ฉันไม่เห็นการโต้ตอบใด ๆ 2.51.62.5y
whuber

3
@ เมื่อฉันลองรหัสของคุณด้วยขนาดตัวอย่างเต็มรูปแบบ (n = 1336) และค่าสัมประสิทธิ์ของบันทึก (ความสูง) อยู่ที่ประมาณ 1.77
Miroslav Sabo

คำตอบ:


13

บทวิจารณ์นี้โดย Eknoyan (2007)มีมากกว่าที่คุณอยากรู้เกี่ยวกับ Quetelet และการคิดค้นดัชนีมวลกายของเขา

รุ่นสั้นคือ BMI มีลักษณะกระจายทั่วไปโดยประมาณในขณะที่น้ำหนักเพียงอย่างเดียวหรือน้ำหนัก / ส่วนสูงไม่ได้และ Quetelet สนใจที่จะอธิบายผู้ชาย "ปกติ" ผ่านทางการแจกแจงแบบปกติ มีข้อโต้แย้งหลักการแรกด้วยเช่นกันโดยขึ้นอยู่กับว่าผู้คนเติบโตอย่างไรและงานที่เพิ่งทำไปเมื่อไม่นานมานี้ได้พยายามเชื่อมโยงสิ่งเหล่านั้นกลับไปปรับใช้กับชีวกลศาสตร์บางอย่าง

เป็นที่น่าสังเกตว่าค่าของ BMI นั้นถกเถียงกันอย่างถึงพริกถึงขิง มันมีความสัมพันธ์กับความอุดมสมบูรณ์ค่อนข้างดี แต่การตัดทอนสำหรับน้ำหนักตัวน้อย / น้ำหนักเกิน / อ้วนไม่ตรงกับผลลัพธ์ด้านการดูแลสุขภาพ


10
ที่สำคัญกว่านั้นเขาคิดว่าweight/height^3สิ่งใดจะตีความได้ว่าเป็นความหนาแน่น (เข้าใจได้โดยสัญชาตญาณ) แต่เลือกใช้ BMI แบบคลาสสิกเนื่องจากการกระจายแบบปกติตามที่คุณพูด
AdamO

4
@AdamO อย่างไรก็ตามผู้ใหญ่โดยทั่วไปเท่านั้นเติบโตใน 2 ใน 3 มิติ ...
เจมส์

10

จาก Adolphe Quetelet ของ "บทความเกี่ยวกับมนุษย์และการพัฒนาคณะของเขา":

หากมนุษย์เพิ่มขึ้นอย่างเท่าเทียมกันในทุกมิติน้ำหนักของเขาในแต่ละวัยจะเท่ากับความสูงของลูกบาศก์ ตอนนี้นี่ไม่ใช่สิ่งที่เราสังเกตจริงๆ น้ำหนักที่เพิ่มขึ้นช้าลงยกเว้นในช่วงปีแรกหลังคลอด จากนั้นสัดส่วนที่เราเพิ่งชี้ให้เห็นก็คือการสังเกตอย่างสม่ำเสมอ แต่หลังจากช่วงเวลานี้และจนกว่าจะถึงอายุรุ่นกระเตาะน้ำหนักจะเพิ่มขึ้นเกือบเท่าตารางของความสูง การพัฒนาของน้ำหนักอีกครั้งอย่างรวดเร็วกลายเป็นวัยแรกรุ่นและเกือบหยุดหลังจากปีที่ยี่สิบห้า โดยทั่วไปแล้วเราจะไม่ผิดพลาดมากนักเมื่อเราคิดว่าในระหว่างการพัฒนากำลังสองของน้ำหนักในแต่ละช่วงอายุนั้นเป็นพลังที่ห้าของความสูง ซึ่งโดยธรรมชาติจะนำไปสู่ข้อสรุปนี้ในการสนับสนุนค่าคงตัวของแรงโน้มถ่วงที่เฉพาะเจาะจงว่าการเติบโตตามขวางของมนุษย์นั้นน้อยกว่าแนวดิ่ง

ดูที่นี่

เขาไม่ได้สนใจในการระบุลักษณะของโรคอ้วน แต่ความสัมพันธ์ระหว่างน้ำหนักกับส่วนสูงในขณะที่เขาสนใจเรื่องรูปทรงเรขาคณิตและเส้นโค้งรูประฆัง การค้นพบของ Quetelet ระบุว่าค่าดัชนีมวลกายมีการกระจายตัวปกติในประชากรโดยประมาณ สิ่งนี้มีความหมายต่อเขาว่าเขาพบความสัมพันธ์ "ถูกต้อง" (น่าสนใจเพียงหนึ่งหรือสองทศวรรษต่อมาฟรานซิสกัลตันจะเข้าหาประเด็นเรื่อง "การกระจายความสูง" ในประชากรและเหรียญคำว่า "การถดถอยสู่ความหมาย")

เป็นที่น่าสังเกตว่าค่าดัชนีมวลกายเป็นสาเหตุของความผิดพลาดทางชีวภาพในยุคปัจจุบันเนื่องจากการศึกษาของ Framingham ถึงการใช้ประโยชน์จากค่าดัชนีมวลกายในฐานะที่เป็นวิธีการระบุความอ้วน ยังมีการขาดตัวทำนายที่ดีของโรคอ้วน (และผลลัพธ์ที่เกี่ยวข้องกับสุขภาพของมัน) อัตราส่วนการวัดรอบเอวและสะโพกเป็นตัวเลือกที่น่าสนใจ หวังว่าเมื่ออัลตราซาวด์มีราคาถูกลงและดีขึ้นแพทย์จะใช้เพื่อระบุว่าไม่เพียง แต่เป็นโรคอ้วนเท่านั้น แต่ยังรวมถึงไขมันที่สะสมและการกลายเป็นปูนในอวัยวะต่างๆและให้คำแนะนำสำหรับการดูแลรักษา


1
2.5

1
Quetelet กำลังอนุมานเกี่ยวกับการพัฒนาของแต่ละบุคคลจากการสังเกตตัวอย่างจากประชากร ฉันคิดว่าเขายังให้ความเห็นเพิ่มเติมว่าโดยเฉลี่ยแล้วคน ๆ หนึ่งสามารถทำได้ดีกับน้ำหนักและส่วนสูงที่เกี่ยวข้องแบบเลขชี้กำลัง 2.5 เท่า (มากกว่าทุกช่วงอายุหรือเกือบทุกช่วงอายุ) แต่โดยเฉพาะในผู้ใหญ่ความสัมพันธ์นั้นเป็นกำลังสอง
AdamO

1
ฉันคิดว่าอัตราส่วนเอวต่อสะโพกได้รับการพิจารณาโดย Quetelet หรือผู้ร่วมสมัยของเขาจริง ๆ แต่ก็ถูกปฏิเสธเพราะมันไม่ได้กระจายตามปกติ เรามากันไกลแค่ไหนแล้ว ....
แมตต์ Krause

8

ค่าดัชนีมวลกายส่วนใหญ่จะใช้ในปัจจุบันเนื่องจากความสามารถในการประมาณปริมาณไขมันอวัยวะภายในช่องท้องมีประโยชน์ในการศึกษาความเสี่ยงโรคหัวใจและหลอดเลือด สำหรับกรณีศึกษาการวิเคราะห์ความเพียงพอของค่าดัชนีมวลกายในการตรวจคัดกรองโรคเบาหวานดูบทที่ 15 ของhttp://biostat.mc.vanderbilt.edu/CourseBios330ภายใต้เอกสารประกอบคำบรรยาย มีการประเมินหลายอย่าง คุณจะเห็นว่าพลังความสูงที่ดีกว่านั้นอยู่ใกล้กับ 2.5 แต่คุณสามารถทำได้ดีกว่าการใช้ความสูงและน้ำหนัก


2
นี่เป็นความคิดเห็นที่ดี - แต่ดูเหมือนจะไม่ได้ตอบคำถามที่ถามถึง "เหตุผลเชิงสถิติ" ที่เป็นรากฐานของสูตร BMI มาตรฐาน
whuber

1
ที่อยู่ในใบเสนอราคา Quetelet ด้านบน
Frank Harrell
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.