นอกเหนือจาก VBA แล้วเราสามารถพัฒนาแอปพลิเคชั่นดังกล่าวโดยใช้ API ของ OpenOffice เพื่ออ่านเนื้อหาของเอกสาร Word ประมวลผลและส่งออกผลลัพธ์เป็นไฟล์ CSV เพื่อเปิดในแอปพลิเคชันสเปรดชีต
อย่างไรก็ตามจริงๆแล้วมันเป็นโค้ดเพียงไม่กี่บรรทัดหากคุณคุ้นเคยกับภาษาการเขียนโปรแกรมใด ๆ
ตัวอย่างเช่นใน Python คุณสามารถทำสิ่งนี้ได้อย่างง่ายดาย:
ที่นี่เรากำหนดฟังก์ชั่นที่เรียบง่ายซึ่งนับคำที่กำหนดในรายการ
def countWords(a_list):
words = {}
for i in range(len(a_list)):
item = a_list[i]
count = a_list.count(item)
words[item] = count
return sorted(words.items(), key = lambda item: item[1], reverse=True)
ส่วนที่เหลือคือการจัดการเนื้อหาของเอกสารก่อนอื่นให้วาง:
content = """This is the content of the word document. Just copy paste it.
It can be very very very very long and it can contain punctuation
(they will be ignored) and numbers like 123 and 4567 (they will be counted)."""
ที่นี่เราลบเครื่องหมายวรรคตอน EOL วงเล็บ ฯลฯ แล้วสร้างรายการคำสำหรับฟังก์ชันของเรา:
import re
cleanContent = re.sub('[^a-zA-Z0-9]',' ', content)
wordList = cleanContent.lower().split()
จากนั้นเราเรียกใช้ฟังก์ชั่นของเราและเก็บผลลัพธ์ (คู่คำนับ) ในรายการอื่นและพิมพ์ผลลัพธ์:
result = countWords(wordList)
for words in result:
print(words)
ดังนั้นผลลัพธ์คือ:
('very', 4)
('and', 3)
('it', 3)
('be', 3)
('they', 2)
('will', 2)
('can', 2)
('the', 2)
('ignored', 1)
('just', 1)
('is', 1)
('numbers', 1)
('punctuation', 1)
('long', 1)
('content', 1)
('document', 1)
('123', 1)
('4567', 1)
('copy', 1)
('paste', 1)
('word', 1)
('like', 1)
('this', 1)
('of', 1)
('contain', 1)
('counted', 1)
คุณสามารถลบวงเล็บและเครื่องหมายจุลภาคโดยใช้การค้นหา / แทนที่หากคุณต้องการ
สิ่งที่คุณต้องทำดาวน์โหลด Python 3 ติดตั้งเปิด IDLE (มาพร้อมกับ Python) แทนที่เนื้อหาของเอกสารคำของคุณและเรียกใช้คำสั่งทีละรายการและตามลำดับที่กำหนด