มีซอฟต์แวร์ที่ทำการวิเคราะห์ข้อความบนบล็อกหรือไม่ [ปิด]


8

บริษัท ของฉันกำลังมองหาการสร้างภาพข้อมูล PivotViewer ของบล็อก Wordpress 2 ของลูกค้าในช่วง 11 ปีที่ผ่านมา อย่างไรก็ตามในการทำเช่นนั้นเราจำเป็นต้องแก้ไขแท็กที่จับจดไม่สมบูรณ์และโดยทั่วไปไม่ดีเพื่อใช้เป็นหมวดหมู่ที่จัดเรียงได้ ฉันกำลังมองหาเครื่องมือที่จะวิเคราะห์รายการบล็อกของพวกเขาและทำการนับจำนวนคำเพื่อให้เราเข้าใจว่าเรากำลังทำอะไรอยู่

เป็นการดีที่มันจะมีคุณสมบัติเหล่านี้ทั้งหมด:

  1. บัญชีดำ Word (เพิกเฉย)
  2. การเกิดคำ
  3. การรวมคำเหมือนที่กำหนดเอง
  4. การนับการใช้งานทั้งหมด
  5. การนับจำนวนโพสต์คำปรากฏขึ้น

ฉันคิดว่าการวิเคราะห์ข้อความแบบนี้จะเป็นเรื่องธรรมดามาก แต่ฉันไม่สามารถหาซอฟต์แวร์ใด ๆ ที่ทำสิ่งนี้ในบล็อกทั้งหมด มีซอฟต์แวร์ให้ทำเช่นนี้หรือไม่?


3
น่าสนใจ เมื่อมีข้อสงสัย Python ได้รับคุณกลับ
James T Snell

ใช่ ... ฉันหวังว่าฉันจะได้ไม่ต้องทำแบบนี้เลย
Brian Bauman

มีบางอย่างที่ทำสิ่งนี้ ... ฉันจำได้ว่าเพื่อนวิเคราะห์วิกิพีเดีย ... ฉันจะตรวจสอบกับเขาในวันพรุ่งนี้
Keltari

คำตอบ:


3

ซอฟต์แวร์ที่คุณกำลังมองหาอาจมีหลายชื่อเช่น"การวิเคราะห์เนื้อหา" , "แท็กคลาวด์"หรือ "เมตาแท็ก" และอีกมากมายเช่น "การวิเคราะห์ข้อความ" และ "การขุดข้อความ"

มีเครื่องมือซอฟต์แวร์มากมายสำหรับวัตถุประสงค์เหล่านี้ทั้งฟรีและเพื่อการพาณิชย์

ฉันไม่ได้มีประสบการณ์ส่วนตัวกับเครื่องมือดังกล่าว แต่ที่ดีสำหรับการเริ่มต้นคือเครื่องมือวิเคราะห์ข้อความที่แสดงรายการเครื่องมือดังกล่าวมากมายทั้งฟรีและเชิงพาณิชย์

อีกรายการดังกล่าวคือการวิเคราะห์ข้อความข้อความการทำเหมืองแร่และดึงข้อมูลซอฟแวร์


ฉันกรองวิธีการของฉันผ่านรายการแรก แต่ไม่มีตัวเลือกฟรีรวมถึงการวิเคราะห์ทางภาษา ยังไม่ได้ตรวจสอบรายการที่สอง - ฉันอาจท้ายม้วนของตัวเอง
Brian Bauman

2

ดูRapidminerหรือWeka

เมื่อเห็นว่าเป็นบล็อกลูกค้าคุณอาจเข้าถึงฐานข้อมูลได้ ดาวน์โหลดบทความทั้งหมดเป็นข้อความธรรมดาและใช้หนึ่งในโปรแกรมข้างต้นเพื่อจัดการกับคำถามการประมวลผลภาษาธรรมชาติ (1,2,3 และ 5)

จำนวนการใช้งานยากที่จะทำให้เป็นจริงโดยอัตโนมัติเนื่องจากเกี่ยวข้องกับการกำหนดความหมายของคำโดยใช้บริบทโดยอัตโนมัติ


การนับการใช้ทั้งหมดไม่ใช่ผู้ใช้ ขอบคุณสำหรับคำแนะนำ
Brian Bauman

ฉันอ่านผิด mybad คุณยังควรชำระเงิน Rapidminer หรือ Weka สำหรับการประมวลผลภาษาธรรมชาติ นั่นคือยกเว้นว่าชุดข้อมูลนั้นมีขนาดใหญ่มากเพราะทั้งคู่พยายามที่จะให้พอดีกับหน่วยความจำ
suweller

2

หนึ่งในซอฟต์แวร์การวิเคราะห์เนื้อหาที่มากที่สุดคือ WordStat ออกแบบโดย Provalis Research

WordStat เป็นโมดูลการวิเคราะห์ข้อความสำหรับ QDA Miner หรือ SimStat WordStat รวมวิธีการวิเคราะห์เนื้อหาโดยใช้วิธีการแบบพจนานุกรมและการสำรวจอัลกอริธึมจำนวนมากหรือวิธีการขุดข้อความแบบต่างๆ WordStat สามารถใช้พจนานุกรมการจัดหมวดหมู่ที่มีอยู่กับคลังข้อความใหม่ นอกจากนี้ยังอาจใช้ในการพัฒนาและตรวจสอบความถูกต้องของพจนานุกรมการจัดหมวดหมู่ใหม่ เมื่อใช้ร่วมกับการเข้ารหัสด้วยตนเองโมดูลนี้สามารถให้ความช่วยเหลือสำหรับการใช้กฎการเข้ารหัสอย่างเป็นระบบมากขึ้นช่วยเปิดเผยความแตกต่างในการใช้คำระหว่างกลุ่มย่อยของบุคคลและช่วยในการแก้ไขการเข้ารหัสที่มีอยู่โดยใช้ตาราง KWIC (Keyword In Context) WordStat ได้รับการออกแบบมาโดยเฉพาะเพื่อศึกษาข้อมูลที่เป็นข้อความเช่นการตอบคำถามปลายเปิดการสัมภาษณ์ชื่อบทความในวารสารการกล่าวสุนทรพจน์สาธารณะการสื่อสารทางอิเล็กทรอนิกส์เป็นต้น

http://provalisresearch.com/products/content-analysis-software/


1

คุณอาจต้องการลองMathematica ของ Wolfram คุณจะต้องทำการเขียนโปรแกรม แต่เครื่องมือทั้งหมดที่คุณต้องการมี:


0

คำถามเหล่านี้บางข้อสามารถตอบได้อย่างรวดเร็วและสกปรกโดยใช้ Google Search ในบล็อกของคุณ (ง่ายที่สุดถ้ามีโดเมนของตัวเอง)


0

Zemanta ทำการวิเคราะห์และสามารถแนะนำแท็กและลิงก์ มันเป็นปลั๊กอินเวิร์ดเพรสเช่นกัน

ปัญหาเท่านั้น: เนื่องจากขณะนี้อยู่ในสถานะปัจจุบันนั้นจำเป็นต้องมีการเปิดด้วยตนเองและการเลือกและการบันทึกของแต่ละโพสต์

มีปลั๊กอินแท็กอัตโนมัติจำนวนมากสำหรับเวิร์ดเพรส คุณควรค้นหาตัวค้นหาปลั๊กอินและลองทำดู

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.