การระบุเหตุการณ์ที่เกี่ยวข้องกับวันที่ในวรรค


13

มีวิธีการแบบอัลกอริทึมในการระบุวันที่ที่ให้ไว้ในย่อหน้าที่สัมพันธ์กับเหตุการณ์ (วลี) ในย่อหน้าหรือไม่?

ตัวอย่างพิจารณาย่อหน้าต่อไปนี้:

ในเดือนมิถุนายนปี 1970 ผู้นำที่ยิ่งใหญ่ได้สาบาน แต่หลังจากเดือนพฤษภาคม 2515 โพสต์การตายของรัฐมนตรีต่างประเทศว่าเขาเข้ามากุมบังเหียนของประเทศ ในขณะที่เขาได้รับความนิยมจนถึงกลางปี ​​1980 อิทธิพลของเขาก็เริ่มลดลงหลังจากนั้น

มีอัลกอริทึม (ที่กำหนดขึ้นหรือสุ่ม) # ที่สามารถสร้าง 2-tuple (วันที่, เหตุการณ์) ที่เหตุการณ์นั้นมีความหมายโดยนัยตามวรรคที่จะเกิดขึ้นในวันที่ ? ในกรณีข้างต้น:

  • (มิถุนายน 2513 ผู้นำที่ยิ่งใหญ่สาบาน)
  • (พฤษภาคม 1972, เข้ามากุมบังเหียน)

    หรือดีกว่าเลย

  • (พฤษภาคม 1972 ผู้นำที่ยิ่งใหญ่เข้ามากุมบังเหียน)
  • (1980 ตกอยู่ในอิทธิพล)

นอกจากนี้ #Later


2
ปัญหานี้ดูเหมือนจะมีสามขั้นตอน: 1) แยกวันที่ 2) แยกกิจกรรมและ 3) เชื่อมโยงชุดข้อมูลทั้งสอง 1) สามารถทำได้และฉันสามารถจินตนาการฮิวริสติกที่เหมาะสมสำหรับ 3) แต่คุณคาดหวังว่าจะแก้ปัญหาอย่างไร 2)
Raphael

1
@ ราฟาเอลการตอบคำถามที่ดีอีกครั้งของฉัน!
ตรวจสอบ 123

ดีทำคุณมีข้อมูลบางประการเกี่ยวกับ 2) เช่นชุดที่ จำกัด ของกิจกรรมที่น่าสนใจ (เช่นคำ)? คุณต้องการแยกคำนาม / คำกริยาคู่ทั้งหมดตราบเท่าที่พวกเขามีวันที่?
Raphael

คุณต้องการแยกกรอบเวลาด้วยหรือไม่ ในตัวอย่างของคุณให้พิจารณาหรือ(<= May 1972, death of the Minister of State) (<= Mid-1980, [the great leader] enjoyed popular support)
Raphael

@ ราฟาเอลขออภัยสำหรับการตอบกลับมาก (มาก) เกี่ยวกับ 2) ไม่ฉันกำลังพยายามหาแนวทางทั่วไป
ตรวจสอบ 123 มีน

คำตอบ:


4

โดยทั่วไปปัญหาในการระบุวันที่และเครื่องหมายชั่วคราวอื่น ๆ ในข้อความที่เรียกว่าปัญหาของการสกัดลำดับที่ขมับ การค้นหาที่เชื่อมโยงจะนำคุณไปสู่เอกสารที่เกี่ยวข้องกับเรื่องนี้


ไม่ทราบว่าปัญหามีชื่อ จะดูเพิ่มเติมเกี่ยวกับสิ่งนั้นและดูว่าฉันสามารถหาสิ่งที่คุ้มค่า :)
เครื่องหมายที่

2

เมื่อคุณขอวิธีอัลกอริทึมฉันจะดื้อดึงเหมือนอัลกอริทึม ฉันขอโทษที่ปฏิบัติต่อคำถามนี้เช่นนี้ แต่เนื่องจากดูเหมือนว่าปัญหาทางทฤษฎีที่ซับซ้อนฉันจะสังเคราะห์วิธีการที่เป็นไปได้

คำถาม: คุณสามารถให้คำจำกัดความเกี่ยวกับอัลกอริทึมของวันที่และเหตุการณ์เฉพาะได้หรือไม่

หากคุณสามารถทำได้:เนื่องจากคำจำกัดความของคุณเป็นอัลกอริธึมดังนั้นนี่อาจเป็นไวยากรณ์แบบเป็นทางการและปัญหาของคุณคือการปรับแต่งไวยากรณ์นั้นเพื่อให้ตรงกับทุกกรณีที่คุณต้องพิจารณา (ฉันสนใจถ้าคุณสามารถให้คำจำกัดความที่แน่นอนซึ่งไม่ใช่ไวยากรณ์ที่เป็นทางการ)

หากคุณทำไม่ได้:อย่างน้อยคุณก็สามารถหาตัวอย่างได้ เอาล่ะแล้ว วิธีคิดที่ดีที่สุดและมีเพียงฉันเท่านั้นที่คิดว่าเป็นวิธีการเรียนรู้ด้วยเครื่องจักรซึ่งคุณจะต้องฝึกอบรมเพื่อให้สามารถจดจำวันที่ของคุณและเหตุการณ์ของคุณได้ (การใช้คลังข้อความโดยใช้หมายเหตุประกอบด้วยมือ) อย่างไรก็ตามสิ่งนี้ค่อนข้างมากเมื่อเทียบกับ regexp ที่ทำด้วยมือขนาดใหญ่ซึ่งอาจจะทำงานได้ ถ้าคุณอยากทำจริงๆฉันคิดว่า regexp ที่มีประสิทธิภาพมากที่สุดจะเป็นพารามิเตอร์สำหรับอัลกอริทึมการเรียนรู้ แต่คุณควรถามผู้เชี่ยวชาญด้านการเรียนรู้ของเครื่อง

ขอให้โชคดีกับสิ่งนี้มันง่ายมากที่จะพูดคุยเกี่ยวกับเรื่องนี้ (ในทั้งสองกรณี)


1
ที่กล่าวว่าผมคิดว่าการรวมวันที่และเหตุการณ์ที่เกิดขึ้นจะแน่นอนต้องมีรูปแบบสุ่ม
Raphael

วันที่ในรูปแบบส่วนใหญ่ฉันสามารถจับภาพโดยใช้ regexp ด้วยตรรกะการเขียนโปรแกรมบางอย่างฉันสามารถแยกประโยครอบวันที่ได้ ปัญหาก็คือฉันต้องการแบบจำลองหรือการแจกแจงความน่าจะเป็นที่เมื่อรูปแบบประโยคเฉพาะเช่น: แมวกินเมาส์เมื่อวันที่ 25 สิงหาคม [<article> <noun> <vermin <article> <noun> <preposition> <วันที่>] จะปรากฏขึ้นพร้อมกับชุดรูปแบบย่อย (ย่อย) แมวกินเมาส์ (ในกรณีของเรา) สัมพันธ์กับวันที่ y (25 สิงหาคม) ด้วยความน่าจะเป็น z
ตรวจสอบ 123

@jmad หากคุณไม่รังเกียจคุณสามารถปรับการจัดรูปแบบโพสต์ของคุณได้หรือไม่ การใช้รูปแบบคำพูดสำหรับข้อความที่ไม่ใช่ (หรืออ้างตนเอง?) ค่อนข้างทำให้เกิดความสับสน
uli
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.