Hessian เชิงประจักษ์ของ M-estimator สามารถไม่มีกำหนดได้หรือไม่?


15

Jeffrey Wooldridge ในการวิเคราะห์เศรษฐมิติของเขาเกี่ยวกับการตัดขวางและข้อมูลพาเนล (หน้า 357) กล่าวว่า Hessian เชิงประจักษ์ "ไม่รับประกันว่าจะแน่นอนแน่นอนหรือแม้กระทั่ง semidefinite บวกสำหรับตัวอย่างเฉพาะที่เรากำลังทำงานอยู่"

นี่ดูเหมือนว่าผิดสำหรับฉัน (ปัญหาเชิงตัวเลขแยกกัน) Hessian จะต้องเป็น semidefinite เชิงบวกอันเป็นผลมาจากคำจำกัดความของ M-estimator ว่าเป็นค่าของพารามิเตอร์ที่ลดฟังก์ชั่นวัตถุประสงค์สำหรับตัวอย่างที่ได้รับและความจริงที่รู้จักกันดีว่า อย่างน้อยที่สุด (ในพื้นที่) Hessian นั้นเป็น semidefinite ที่เป็นบวก

ข้อโต้แย้งของฉันถูกต้องหรือไม่

[แก้ไข: คำสั่งถูกลบในฉบับที่ 2 ของหนังสือ ดูความคิดเห็น]

ภูมิหลังสมมติว่าθ Nเป็นประมาณการที่ได้รับโดยการลด 1θ^N

1Ni=1Nq(wi,θ),
ที่wiหมายถึงiสังเกต -th

เรามาแทน Hessian ของด้วย , qH

H(q,θ)ij=2qθiθj

ความแปรปรวนร่วมซีมโทติคของเกี่ยวข้องกับโดยที่เป็นค่าพารามิเตอร์ที่แท้จริง วิธีหนึ่งในการประมาณค่าคือการใช้ Hesssian เชิงประจักษ์θ^nE[H(q,θ0)]θ0

H^=1Ni=1NH(wi,θ^n)

มันเป็นความแน่นอนของซึ่งเป็นปัญหาH^


1
@Jyotirmoy จะเกิดอะไรขึ้นถ้าค่าต่ำสุดเกิดขึ้นที่ขอบเขตของพื้นที่พารามิเตอร์ของคุณ?
พระคาร์ดินัล

@cardinal คุณพูดถูกฉันจะไม่ทำงานในกรณีนั้น แต่ Wooldridge กำลังพิจารณากรณีที่ต่ำสุดอยู่ในการตกแต่งภายใน เขาไม่ผิดหรอกเหรอ?
Jyotirmoy Bhattacharya

@Jyotirmoy แน่นอนมันอาจเป็นเพียง semidefinite บวก นึกถึงฟังก์ชั่นเชิงเส้นหรือฟังก์ชันที่ชุดของจุดต่ำสุดในรูปแบบ polytope นูน สำหรับตัวอย่างที่ง่ายพิจารณาใด ๆ พหุนามที่x = 0 f(x)=x2nx=0
พระคาร์ดินัล

1
@cardinal จริง สิ่งที่ทำให้ฉันหนักใจคือวลี "แม้แต่ semidefinite บวก" ในข้อความที่ยกมา
Jyotirmoy Bhattacharya

@Jyotirmoy มีรูปแบบเฉพาะของ M-estimator ที่ให้ไว้ในหนังสือที่คุณสามารถให้ได้หรือไม่? ให้พื้นที่พารามิเตอร์ภายใต้การพิจารณาด้วย บางทีเราสามารถคิดออกว่าผู้เขียนมีในใจ โดยทั่วไปแล้วฉันคิดว่าเราได้ยืนยันแล้วว่าการยืนยันของผู้เขียนนั้นถูกต้อง การวางข้อ จำกัด เพิ่มเติมในรูปแบบของหรือพื้นที่พารามิเตอร์ที่พิจารณานั้นอาจเปลี่ยนแปลง q
พระคาร์ดินัล

คำตอบ:


16

ฉันคิดว่าคุณพูดถูก ลองกลั่นอาร์กิวเมนต์ของคุณเพื่อสาระสำคัญของมัน:

  1. ลดฟังก์ชันQกำหนดเป็นQ(θ)=1θ^NQQ(θ)=1Ni=1Nq(wi,θ).

  2. ให้เป็น Hessian ของQดังนั้นH ( θ ) = 2 QHQโดยความหมายและในทางกลับโดยการเชิงเส้นของความแตกต่างเท่ากับ1H(θ)=2Qθiθj)1Ni=1NH(wi,θn)

  3. สมมติว่าθโกหกในการตกแต่งภายในของโดเมนของ Qแล้ว H ( θ N )ต้องเป็นบวกกึ่งแน่นอนθ^NQH(θ^N)

นี้เป็นเพียงคำสั่งเกี่ยวกับฟังก์ชั่น : วิธีการที่จะกำหนดไว้เป็นเพียงความฟุ้งซ่านยกเว้นตราบเท่าที่สันนิษฐานอนุพันธ์ลำดับที่สองของคิวด้วยความเคารพอาร์กิวเมนต์ที่สอง ( θ ) มั่นใจอนุพันธ์ลำดับที่สองของQQqθQ


การหาตัวประมาณ M อาจทำได้ยาก พิจารณาข้อมูลเหล่านี้โดย @mpiktas:

{1.168042, 0.3998378}, {1.807516, 0.5939584}, {1.384942, 3.6700205}, {1.327734, -3.3390724}, {1.602101, 4.1317608}, {1.604394, -1.9045958}, {1.124633, -3.0865249}, {1.294601, -1.8331763},{1.577610, 1.0865977}, { 1.630979, 0.7869717}

โพรซีเดอร์ R เพื่อค้นหา M-estimator ด้วยสร้างโซลูชัน( c 1 , cq((x,y),θ)=(yc1xc2)4 = ( - 114.91316 , - 32.54386 ) มูลค่าของฟังก์ชันวัตถุประสงค์ (ค่าเฉลี่ยของ q ) ณ จุดนี้เท่ากับ 62.3542 นี่คือพล็อตของพอดี:(c1,c2)(114.91316,32.54386)q

พอดี 1

นี่คือพล็อตของฟังก์ชั่นวัตถุประสงค์ (บันทึก) ในพื้นที่ใกล้เคียงของแบบนี้:

วัตถุประสงค์ 1

มีบางอย่างที่นี่คาว:พารามิเตอร์ของความพอดีอยู่ไกลจากพารามิเตอร์ที่ใช้ในการจำลองข้อมูล (ใกล้ ) และเราดูเหมือนจะไม่น้อย: เราอยู่ในหุบเขาตื้นที่ลาดมาก ต่อค่าที่มากขึ้นของพารามิเตอร์ทั้งสอง:(0.3,0.2)

วัตถุประสงค์ 1, มุมมอง 3 มิติ

ปัจจัยลบของ Hessian ณ จุดนี้ยืนยันว่านี่ไม่ใช่ขั้นต่ำในท้องถิ่น! อย่างไรก็ตามเมื่อคุณดูฉลากแกน z คุณจะเห็นได้ว่าฟังก์ชั่นนี้มีความแม่นยำระดับห้าหลักภายในขอบเขตทั้งหมดเนื่องจากมันมีค่าคงที่ 4.1329 (ลอการิทึม 62.354) นี่อาจทำให้ฟังก์ชั่น R ลดขนาดฟังก์ชั่น (พร้อมค่าความคลาดเคลื่อนเริ่มต้น) เพื่อสรุปว่ามันใกล้ขั้นต่ำแล้ว

ในความเป็นจริงการแก้ปัญหาอยู่ไกลจากจุดนี้ เพื่อให้แน่ใจในการค้นหาฉันใช้วิธีคำนวณ " Principal Axis " ที่มีราคาแพง แต่มีประสิทธิภาพสูงในMathematicaโดยใช้ความแม่นยำ 50 หลัก (ฐาน 10) เพื่อหลีกเลี่ยงปัญหาเชิงตัวเลขที่อาจเกิดขึ้น พบขั้นต่ำใกล้ที่ฟังก์ชันวัตถุประสงค์มีค่า 58.292655: ประมาณ 6% เล็กกว่า "ขั้นต่ำ" ที่พบโดย R. ขั้นต่ำนี้เกิดขึ้นในส่วนที่ดูแบนมาก แต่ฉันสามารถทำให้มันดู (เพิ่งจะ) เหมือนขั้นต่ำจริงกับรูปวงรีโดยการเกินจริง c 2(c1,c2)=(0.02506,7.55973)c2 ทิศทางในโครงเรื่อง:

วัตถุประสงค์ 2

รูปทรงมีช่วงจาก 58.29266 ที่อยู่ตรงกลางจนถึง 58.29284 ที่มุม (!) นี่คือมุมมอง 3 มิติ (อีกครั้งของวัตถุประสงค์บันทึก):

วัตถุประสงค์ 2, มุมมอง 3 มิติ

นี่คือรัฐ Hessian บวกแน่นอน: ค่าลักษณะเฉพาะของมันคือ 55062.02 และ 0.430978 ดังนั้นจุดนี้เป็นอย่างน้อยในท้องถิ่น (และน่าจะเป็นขั้นต่ำทั่วโลก) นี่คือแบบที่มันสอดคล้องกับ:

พอดี 2

ฉันคิดว่ามันดีกว่าอันอื่น ค่าพารามิเตอร์นั้นเหมือนจริงมากขึ้นและชัดเจนว่าเราจะไม่สามารถทำได้ดีกว่ากับเส้นโค้งตระกูลนี้

มีบทเรียนที่มีประโยชน์ที่เราสามารถดึงได้จากตัวอย่างนี้:

  1. การเพิ่มประสิทธิภาพเชิงตัวเลขอาจเป็นเรื่องยากโดยเฉพาะอย่างยิ่งกับฟังก์ชั่นการสูญเสียแบบไม่เชิงเส้นและไม่สมการกำลังสอง ดังนั้น:
  2. ตรวจสอบผลลัพธ์อีกครั้งหลายวิธีรวมถึง:
  3. กราฟฟังก์ชั่นวัตถุประสงค์เมื่อใดก็ตามที่คุณสามารถ
  4. เมื่อผลที่เป็นตัวเลขปรากฏว่าเป็นการฝ่าฝืนทฤษฎีบททางคณิตศาสตร์ต้องสงสัยอย่างยิ่ง
  5. เมื่อผลลัพธ์ทางสถิติน่าประหลาดใจเช่นค่าพารามิเตอร์ที่น่าประหลาดใจที่ส่งคืนโดยรหัส R จะต้องสงสัยเป็นพิเศษ

+1 การวิเคราะห์ที่ดี ฉันคิดว่านั่นเป็นเหตุผลที่ Wooldridge รวมคำพูดไว้ ฉันยังคงคิดว่าเป็นไปได้ที่จะคิดตัวอย่างที่รัฐจะไม่มีกำหนด ยกตัวอย่างเช่นการ จำกัด พื้นที่พารามิเตอร์โดยไม่ได้ตั้งใจ ในตัวอย่างนี้พื้นที่ของพารามิเตอร์คือระนาบทั้งหมดนั่นคือสาเหตุที่ค่าต่ำสุดในพื้นที่จะให้ hessian แบบกึ่งบวก ผมคิดว่าเวลาที่มีมาในการเขียนอีเมลที่ดีที่จะ Wooldridge ที่จะได้รับใช้เวลาของเขากับคำถาม :)
mpiktas

@mpiktas ใช่ฉันแน่ใจว่ามีปัญหาที่ค่าต่ำสุดทั่วโลกภายในมี Hessian ไม่ จำกัดแต่ที่พารามิเตอร์ทั้งหมดสามารถระบุได้ แต่มันเป็นไปไม่ได้ที่ Hessian จะสามารถตกแต่งภายในได้อย่างราบรื่นเพียงพอทั่วโลก เรียงลำดับของสิ่งนี้ได้รับการพิสูจน์อีกครั้งและอีกครั้งเช่นใน Milnor ของโทโพโลยีจากมุมมองอนุพันธ์ ฉันสงสัยว่า Wooldridge อาจถูกเข้าใจผิดโดย "ตัวเลข" (การพิมพ์ผิดในหน้าที่ยกมาแนะนำให้เขียนอย่างเร่งด่วน)
whuber

แม้แต่ในเขตแดนเฮสเซียนจะเป็นด้านบวก? ฉันจะตรวจสอบหนังสือฉันเห็นว่าฉันไม่มีความรู้กว้างขวางในเรื่องนี้ ทฤษฎีบทคลาสสิกนั้นง่ายมากดังนั้นฉันจึงสันนิษฐานว่าไม่ควรมีอะไรที่ซับซ้อนมากนัก นั่นอาจเป็นหนึ่งในเหตุผลที่ฉันมีปัญหาในการตอบคำถาม
mpiktas

@mpiktas ในขอบเขตที่รัฐจะไม่จำเป็นต้องได้รับการกำหนดไว้ แนวคิดนี้คือ: หากเมทริกซ์อนุพันธ์ของ Jacobian / Hessian / วินาทีถูกกำหนดไว้ที่จุดวิกฤติจากนั้นในย่านนั้นฟังก์ชันจะทำหน้าที่คล้ายกับกำลังสองที่กำหนดโดยเมทริกซ์นี้ หากเมทริกซ์มีค่าลักษณะเฉพาะค่าบวกและลบฟังก์ชันจะต้องเพิ่มขึ้นในบางทิศทางและลดค่าอื่น ๆ ลง: มันไม่สามารถเป็นแรงผลักดันในท้องถิ่น นี่คือสิ่งที่เกี่ยวข้อง @Jyotirmoy เกี่ยวกับใบเสนอราคาซึ่งดูเหมือนจะขัดแย้งกับคุณสมบัติพื้นฐานนี้
whuber

ขอบคุณทั้งคุณและ @mpiktas สำหรับการวิเคราะห์ที่ดีมาก ฉันมักจะเห็นด้วยกับคุณว่า Wooldridge ทำให้เกิดความสับสนกับตัวเลขด้วยคุณสมบัติเชิงทฤษฎีของตัวประมาณ ลองดูว่ามีคำตอบอื่น ๆ อีกไหม
Jyotirmoy Bhattacharya

7

ใบเสนอราคาในเต็มรูปแบบที่สามารถพบได้ที่นี่ ประมาณการθ Nเป็นวิธีการแก้ปัญหาของการลด (คนหน้า 344 ):θ^N

minθΘN1i=1Nq(wi,θ)

θ^NΘH^

N1i=1Nq(wi,θ)θ0

minθΘEq(w,θ).

N1i=1Nq(wi,θ)Θซึ่ง Hessian ของฟังก์ชันวัตถุประสงค์ไม่จำเป็นต้องเป็นบวกแน่นอน

เพิ่มเติมในหนังสือของเขา Wooldridge ให้ตัวอย่างของการประเมินของ Hessian ซึ่งรับประกันได้ว่าจะเป็นตัวเลขที่แน่นอนแน่นอน ในทางปฏิบัติแล้วความไม่แน่นอนในเชิงบวกของ Hessian ควรระบุว่าการแก้ปัญหานั้นอยู่ที่ขอบเขตหรืออัลกอริทึมล้มเหลวในการหาวิธีแก้ไข ซึ่งโดยปกติจะเป็นตัวบ่งชี้เพิ่มเติมว่าโมเดลที่ติดตั้งอาจไม่เหมาะสมสำหรับข้อมูลที่กำหนด

นี่คือตัวอย่างที่เป็นตัวเลข ฉันสร้างปัญหากำลังสองน้อยที่สุดแบบไม่เป็นเชิงเส้น:

yi=c1xic2+εi

X[1,2]εσ2set.seed(3)xiyi

ฉันเลือกสแควร์ฟังก์ชั่นวัตถุประสงค์ของฟังก์ชั่นวัตถุประสงค์สแควร์สแควร์น้อยแบบไม่เชิงเส้นปกติ:

q(w,θ)=(yc1xic2)4

นี่คือรหัสใน R สำหรับฟังก์ชั่นการเพิ่มประสิทธิภาพการไล่ระดับสีและกระสอบของมัน

##First set-up the epxressions for optimising function, its gradient and hessian.
##I use symbolic derivation of R to guard against human error    
mt <- expression((y-c1*x^c2)^4)

gradmt <- c(D(mt,"c1"),D(mt,"c2"))

hessmt <- lapply(gradmt,function(l)c(D(l,"c1"),D(l,"c2")))

##Evaluate the expressions on data to get the empirical values. 
##Note there was a bug in previous version of the answer res should not be squared.
optf <- function(p) {
    res <- eval(mt,list(y=y,x=x,c1=p[1],c2=p[2]))
    mean(res)
}

gf <- function(p) {
    evl <- list(y=y,x=x,c1=p[1],c2=p[2]) 
    res <- sapply(gradmt,function(l)eval(l,evl))
    apply(res,2,mean)
}

hesf <- function(p) {
    evl <- list(y=y,x=x,c1=p[1],c2=p[2]) 
    res1 <- lapply(hessmt,function(l)sapply(l,function(ll)eval(ll,evl)))
    res <- sapply(res1,function(l)apply(l,2,mean))
    res
}

การทดสอบครั้งแรกที่ใช้เกรเดียนต์และแบบ hessian ตามที่โฆษณาไว้

set.seed(3)
x <- runif(10,1,2)
y <- 0.3*x^0.2

> optf(c(0.3,0.2))
[1] 0
> gf(c(0.3,0.2))
[1] 0 0
> hesf(c(0.3,0.2))
     [,1] [,2]
[1,]    0    0
[2,]    0    0
> eigen(hesf(c(0.3,0.2)))$values
[1] 0 0

xy

> df <- read.csv("badhessian.csv")
> df
          x          y
1  1.168042  0.3998378
2  1.807516  0.5939584
3  1.384942  3.6700205
4  1.327734 -3.3390724
5  1.602101  4.1317608
6  1.604394 -1.9045958
7  1.124633 -3.0865249
8  1.294601 -1.8331763
9  1.577610  1.0865977
10 1.630979  0.7869717
> x <- df$x
> y <- df$y
> opt <- optim(c(1,1),optf,gr=gf,method="BFGS")  
> opt$par
[1] -114.91316  -32.54386
> gf(opt$par)
[1] -0.0005795979 -0.0002399711
> hesf(opt$par)
              [,1]         [,2]
[1,]  0.0002514806 -0.003670634
[2,] -0.0036706345  0.050998404
> eigen(hesf(opt$par))$values
[1]  5.126253e-02 -1.264959e-05

การไล่ระดับสีเป็นศูนย์ แต่กระนั้นก็ไม่ได้เป็นบวก

หมายเหตุ:นี่เป็นความพยายามครั้งที่สามของฉันในการให้คำตอบ ฉันหวังว่าในที่สุดฉันก็สามารถที่จะให้คำสั่งทางคณิตศาสตร์ที่แม่นยำซึ่ง eluded ฉันในรุ่นก่อนหน้า


wyxw=(x,y)ym(x,θ)m(x,θ)

@mpiktas ฉันไม่ได้ค่อนข้างแน่ใจว่าวิธีการตีความประโยคแรกของคุณเนื่องจากถ้อยคำ ฉันสามารถเห็นสองวิธีหนึ่งที่ฉันเรียกถูกต้องและอื่น ๆ ที่ฉันจะไม่ อีกทั้งการพูดอย่างเคร่งครัดฉันไม่เห็นด้วยกับประโยคที่สองในย่อหน้าแรกของคุณ ดังที่ฉันได้แสดงไว้ข้างต้นมันเป็นไปได้ที่จะน้อยที่สุดในพื้นที่ภายในของพื้นที่พารามิเตอร์โดยไม่ต้องรัฐ Hessian เป็นบวกแน่นอน
พระคาร์ดินัล

wyxw=(x,y)

@ cardinal ฉันแก้ไขข้อความของฉัน ตอนนี้มันควรจะโอเค ขอบคุณสำหรับการชี้ให้เห็นปัญหา
mpiktas

@mptikas ทั้ง Wooldridge และฉันไม่ได้อ้างว่า Hessian นั้นจะต้องมีความแน่นอนในเชิงบวกทุกที่ การเรียกร้องของฉันคือว่าสำหรับการตกแต่งภายในสูงสุด Hessian เชิงประจักษ์จะต้องมี semidefinite บวกเป็นเงื่อนไขที่จำเป็นของฟังก์ชั่นที่ราบรื่นถึงระดับสูงสุด ดูเหมือนว่า Wooldridge จะพูดอะไรที่แตกต่างออกไป
Jyotirmoy Bhattacharya

3

รัฐที่ไม่มีที่สิ้นสุดที่จุดอาน เป็นไปได้ว่านี่อาจเป็นจุดคงที่เดียวในการตกแต่งภายในของพื้นที่พารามิเตอร์

อัปเดต: ให้ฉันทำอย่างละเอียด ก่อนอื่นสมมติว่า Hessian เชิงประจักษ์มีอยู่ทั่วไป

θ^niq(wi,)(1/N)iH(wi,θ^n)θ^niq(wi,)θ^n

argminθiq(wi,θ)

0=iq˙(wi,θ),
q˙q(w,θ)θΨ

พูดจริงแม้แต่ Hessian ที่เป็นบวกแน่นอนซึ่งเกือบจะเป็นเอกเทศหรือมีสภาพไม่ดีก็จะแนะนำว่าตัวประมาณนั้นแย่และคุณต้องกังวลมากกว่าการประมาณค่าความแปรปรวน


x2y2

+1 คะแนนดีในการอัปเดตโดยเฉพาะย่อหน้าสุดท้าย เมื่อรัฐ Hessian พร้อมใช้งาน - ตามที่คาดการณ์ไว้โดยปริยายตลอดการสนทนาเราจะใช้ความมั่นใจในเชิงบวกโดยอัตโนมัติเป็นหนึ่งในเกณฑ์สำหรับการทดสอบจุดวิกฤติใด ๆ และปัญหานี้ก็ไม่สามารถเกิดขึ้นได้ สิ่งนี้ทำให้ฉันเชื่อว่าคำพูดของ Wooldridge จะต้องเกี่ยวข้องกับ Hessian ในระดับต่ำสุดของโลกซึ่งไม่ใช่จุดวิกฤติเพียงอย่างเดียว
whuber

1

มีการถกเถียงกันอย่างหนักหน่วงในพุ่มไม้ในหัวข้อนี้ว่า Hessian นั้นจะต้องเป็นบวก (กึ่ง) แน่นอนอย่างน้อยที่สุดในท้องถิ่น ดังนั้นฉันจะทำให้ชัดเจนว่า

ZZT(Hessian of Lagrangian)Z

ดังนั้น Hessian ของฟังก์ชันวัตถุประสงค์ในปัญหาข้อ จำกัด ที่มีข้อ จำกัด ที่ใช้งานไม่จำเป็นต้องเป็น semidefinite บวกถ้ามีข้อ จำกัด ที่ใช้งานอยู่

หมายเหตุ:

1) ข้อ จำกัด ที่ใช้งานอยู่ประกอบด้วยข้อ จำกัด ด้านความเท่าเทียมกันทั้งหมดรวมถึงข้อ จำกัด ที่ไม่เท่าเทียมซึ่งพอใจกับความเสมอภาค

2) ดูความหมายของลากรองจ์ที่https://www.encyclopediaofmath.org/index.php/Karush-Kuhn-Tucker_conditions

3) หากข้อ จำกัด ทั้งหมดเป็นแบบเส้นตรงดังนั้น Hessian of Lagrangian = Hessian ของฟังก์ชันวัตถุประสงค์เพราะอนุพันธ์อันดับที่ 2 ของฟังก์ชันเชิงเส้นเป็นศูนย์ แต่คุณยังคงต้องทำแจ๊สในการฉายหากมีข้อ จำกัด ใด ๆ โปรดทราบว่าข้อ จำกัด ขอบเขตล่างหรือบนเป็นกรณีพิเศษของข้อ จำกัด ความไม่เท่าเทียมกันเชิงเส้น หากข้อ จำกัด เดียวที่ทำงานอยู่นั้นคือข้อ จำกัด ที่ถูกผูกไว้ภาพของ Hessian ในพื้นที่ว่างของ Jacobian ของข้อ จำกัด ที่ใช้งานอยู่จะกำจัดจำนวนแถวและคอลัมน์ของ Hessian ที่สอดคล้องกับองค์ประกอบเหล่านั้นในขอบเขตของพวกเขา

4) เนื่องจากตัวคูณลากรองจ์ของข้อ จำกัด ที่ไม่ได้ใช้งานเป็นศูนย์ถ้าไม่มีข้อ จำกัด ที่ใช้งาน, Hessian ของ Lagrangian = the Hessian ของฟังก์ชันวัตถุประสงค์และเมทริกซ์เอกลักษณ์เป็นพื้นฐานสำหรับพื้นที่ว่างของ Jacobian ของข้อ จำกัด ที่ใช้งานอยู่ซึ่ง ผลในการทำให้เข้าใจง่ายของเกณฑ์เป็นเงื่อนไขที่คุ้นเคยว่า Hessian ของฟังก์ชันวัตถุประสงค์จะเป็น semidefinite บวกที่ต่ำสุดที่ท้องถิ่น (บวกแน่นอนถ้าขั้นต่ำที่เข้มงวดในท้องถิ่น)


0

คำตอบเชิงบวกข้างต้นเป็นความจริง แต่พวกเขาไม่ได้ระบุสมมติฐานที่สำคัญ - หากแบบจำลองของคุณไม่ได้รับการระบุ (หรือหากมีการระบุไว้เท่านั้น) คุณอาจจริง ๆ ตามที่ Wooldridge ระบุไว้อย่างถูกต้อง เพียงเรียกใช้โมเดล Psychometric / เศรษฐมิติที่ไม่ใช่ของเล่นและดูด้วยตัวคุณเอง


เนื่องจากสิ่งนี้ดูเหมือนจะไม่เป็นไปได้ในทางคณิตศาสตร์คุณสามารถเสนอตัวอย่างง่าย ๆ ที่ชัดเจนเพื่อแสดงให้เห็นว่า Hessian ของฟังก์ชันวัตถุประสงค์ที่แตกต่างกันสองครั้งอย่างต่อเนื่องอาจล้มเหลวในการเป็น PSD ในระดับโลกได้หรือไม่?
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.