เราจะคัดลอกข้อความจาก Wikipedia โดยไม่มีส่วนอ้างอิง“ [1]”,“ [2]”,“ [3]” ได้อย่างไร


10

หากเราคัดลอกข้อความจากหน้า Wikipediaนี่คือสิ่งที่เราได้รับโดยสังเขป:

ประโยคระยะห่างเป็นช่องว่างแนวนอนระหว่างประโยคในข้อความเรียงพิมพ์ มันเป็นเรื่องของการประชุมการพิมพ์ [1]ตั้งแต่การแนะนำการพิมพ์แบบเคลื่อนย้ายได้ในยุโรปอนุสัญญาระยะห่างประโยคต่าง ๆ ถูกนำมาใช้ในภาษาที่มีตัวอักษรละตินมา [2] สิ่งเหล่านี้รวมถึงการเว้นวรรคคำปกติ (ระหว่างคำในประโยค), การเว้นวรรคเดียว, การเว้นวรรคเต็มสองครั้ง, และล่าสุดในสื่อดิจิทัลไม่มีช่องว่าง [3]ถึงแม้ว่าแบบอักษรดิจิทัลที่ทันสมัยสามารถปรับช่องว่างคำเดียวโดยอัตโนมัติเพื่อสร้างภาพที่น่าพอใจและระยะห่างที่สอดคล้องกันตามเครื่องหมายวรรคตอนของ terminal, [4] การอภิปรายส่วนใหญ่เกี่ยวกับว่าจะตี spacebar ของแป้นพิมพ์ครั้งหรือสองครั้งระหว่างประโยค [5]

ฉันไม่ต้องการคัดลอกชิ้นส่วน[1]และ[2]อื่น ๆ นี่คือสิ่งที่ฉันต้องการคัดลอก:

ประโยคระยะห่างเป็นช่องว่างแนวนอนระหว่างประโยคในข้อความเรียงพิมพ์ มันเป็นเรื่องของการประชุมการพิมพ์ นับตั้งแต่เปิดตัวการพิมพ์แบบเคลื่อนย้ายได้ในยุโรปการประชุมเว้นวรรคประโยคต่าง ๆ ถูกนำมาใช้ในภาษาที่มีอักษรละตินมา สิ่งเหล่านี้รวมถึงการเว้นวรรคคำปกติ (ระหว่างคำในประโยค), การเว้นวรรคเดียว, การเว้นวรรคเต็มสองครั้ง, และล่าสุดในสื่อดิจิทัลไม่มีช่องว่าง แม้ว่าแบบอักษรดิจิทัลที่ทันสมัยสามารถปรับช่องว่างคำเดียวโดยอัตโนมัติเพื่อสร้างการมองเห็นที่น่าพอใจและระยะห่างที่สอดคล้องกันตามเครื่องหมายวรรคตอนเทอร์มินัลการอภิปรายส่วนใหญ่เกี่ยวกับว่าจะเคาะแป้นเว้นวรรคของแป้นพิมพ์หนึ่งหรือสองครั้งระหว่างประโยค

คำตอบที่เลือกไว้ด้านล่างใช้ regex แต่มันไม่ได้ทุกครั้งที่ทำงาน (หากข้อความจริงมีอยู่จริง[และ]regex ไม่ควรลบออก)

มีวิธีแก้ปัญหาที่ดีกว่านี้ไหม?


สิ่งเหล่านี้เป็นข้อมูลอ้างอิงซึ่งอาจมีความสำคัญเนื่องจากมักสนับสนุนความน่าเชื่อถือของข้อมูลที่นำเสนอ การรวมการอ้างอิงนั้นมีประโยชน์โดยเฉพาะกับนักวิจัย
Randolf Richardson

@ Randolf รวมถึงการอ้างอิงจะเป็นประโยชน์โดยเฉพาะอย่างยิ่งสำหรับนักวิจัย ไม่ใช่สำหรับสิ่งมีชีวิตปกติที่เพียงต้องการข้อมูล
Pacerier

คุณลักษณะการค้นหาและแทนที่ตัวประมวลผลคำของคุณซึ่งอาจเรียกจากมาโครอาจมีประโยชน์ในที่นี้
Keith

ฉันลงคะแนนคำถามของคุณไปแล้วเพราะฉันคิดว่าเป็นคำถามที่ดี เกี่ยวกับการอ้างอิงหลายคนคาดหวังที่จะเห็นพวกเขาโดยเฉพาะอาจารย์ในมหาวิทยาลัย (ถ้าคุณวางแผนที่จะเข้าร่วมคุณจะพบว่าอาจารย์ส่วนใหญ่คาดว่าจะมีการอ้างอิงอยู่ในเอกสารการวิจัยที่คุณเขียนและคุณอาจ ได้ยินนักเรียนคนอื่นพูดถึงการอ้างอิงเป็นครั้งคราว)
Randolf Richardson

@ Randolf ฉันหมายถึงฉันต้องการเก็บข้อมูลสำหรับการอ่านและการใช้งานในอนาคตส่วนบุคคล
Pacerier

คำตอบ:


10

bookmarklet คือเพื่อนของคุณ ...

สร้างบุ๊คมาร์คของเบราว์เซอร์ใหม่และคัดลอกรหัส javascript ด้านล่างลงในมัน - เมื่อคุณต้องการคัดลอกข้อความบางส่วนจากวิกิพีเดียเพียงคลิกที่มันล่วงหน้าและมันจะลบอินสแตนซ์ทั้งหมดของ[n]เพื่อตอบสนองความต้องการของคุณ

javascript:function a (){document.body.innerHTML=document.body.innerHTML.replace(/<sup\b[^>]*>(.*?)<\/sup>/gi, "" );return;}; a();

เบื้องหลังมันเป็นการค้นหานิพจน์ปกติและแทนที่<sup>...</sup>แท็ก HTML ทั้งหมดบนหน้าเว็บ

ฉันเพิ่งลองใน IE7 และใช้งานได้ดีดังนั้นหวังว่าจะโอเคกับเบราว์เซอร์อื่น ๆ ด้วย

ฉันจะให้เครดิตเธรด SO นี้โดยชี้ไปในทิศทางที่ถูกต้อง - ฉันรู้ว่า bookmarklet เป็นวิธีที่จะไป แต่ไม่เคยเขียนมาก่อน


1
+1 นี่คือวิธีเดียวที่ฉันสามารถคิดได้ แม้ส่วนขยายเบราว์เซอร์เพิ่มเติมจะต้องใช้การวิเคราะห์ Javascript บางอย่างเพื่อทำสิ่งนี้ (และส่วนใหญ่จะทำจริง)
พัฒนา
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.