มี API ใดบ้างสำหรับการรวบรวมข้อมูลบทคัดย่อของกระดาษ?


13

หากฉันมีรายชื่อกระดาษที่ยาวมากฉันจะได้นามธรรมของเอกสารเหล่านี้จากอินเทอร์เน็ตหรือฐานข้อมูลใด ๆ

ชื่อกระดาษมีลักษณะเหมือน "การประเมินยูทิลิตี้ในการขุดบนเว็บสำหรับโดเมนด้านสาธารณสุข"

มีใครรู้ API ใดบ้างที่สามารถให้ทางออกแก่ฉันได้? ฉันพยายามรวบรวมข้อมูล google scholar อย่างไรก็ตาม google บล็อกโปรแกรมรวบรวมข้อมูลของฉัน


2
ฉันสงสัยว่ามี API ทั่วไปสำหรับเรื่องนี้ คุณสามารถลองรวบรวมข้อมูลบริการต่าง ๆ เช่น Academia.edu ไซต์ของผู้เผยแพร่และอื่น ๆ อย่างไรก็ตามมันจะง่ายกว่าในการสร้างฐานข้อมูลภายในของเอกสารก่อนจากนั้นทำการทดสอบด้วยการแยกบทคัดย่อ
วอย Walczak

ขอบคุณสำหรับคำตอบ! ฉันได้สร้างฐานข้อมูลท้องถิ่นสำหรับสิ่งนี้แล้ว ปัญหาของการรวบรวมข้อมูลจากบริการต่าง ๆ คือฉันต้องทำกฎการแยกวิเคราะห์สำหรับแต่ละเว็บไซต์
Alex Gao

แล้วแปลง PDF เป็น TXT แล้วแยกบทคัดย่อด้วยนิพจน์ปกติ
วอย Walczak

ขอบคุณ! อย่างไรก็ตามสัญญาระบุว่าไม่อนุญาตให้มีการดาวน์โหลดเอกสารจำนวนมาก สิ่งนี้ทำให้เกิดอาการปวดหัว
Alex Gao

2
ฉันคิดว่าลิงก์คำตอบสแต็ค - โอเวอร์โฟลว์นี้ให้คำตอบที่ดีที่สุดที่ฉันจะได้รับ บางทีผู้ที่ประสบปัญหานี้อาจดูที่หน้านี้
Alex Gao

คำตอบ:


8

เงยหน้าขึ้นมอง:

หากคุณได้รับการจับคู่ชื่อที่แน่นอนเดียวแล้วคุณอาจพบบทความที่ถูกต้องและสามารถกรอกข้อมูลที่เหลือจากที่นั่น ทั้งสองให้ลิงก์ดาวน์โหลดและเอาต์พุตสไตล์ bibtex สิ่งที่คุณอาจต้องการทำเพื่อให้ได้เมตาดาต้าที่สมบูรณ์แบบคือการดาวน์โหลดและแยกไฟล์ pdf (ถ้ามี) และมองหาตัวระบุสไตล์ DOI

โปรดทำตัวดีและให้ จำกัด คำขอของคุณถ้าคุณทำเช่นนี้


5

arXiv มีAPI และการดาวน์โหลดจำนวนมากแต่ถ้าคุณต้องการบางสิ่งบางอย่างสำหรับวารสารที่จ่ายเงินมันจะยากที่จะเกิดขึ้นโดยไม่ต้องจ่ายดัชนีใด ๆ เช่น pubmed หรือ elsevier หรืออื่น ๆ


1
ขอบคุณมาก. อย่างไรก็ตาม arXiv ให้เอกสารที่ฉันต้องการ
Alex Gao
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.