ใยแมงมุมสำหรับ Ubuntu


11

ฉันกำลังมองหาแมงมุมเว็บสำหรับอูบุนตูเช่นนี้WebRipper - Calluna ซอฟแวร์ คุณสามารถดาวน์โหลดทั้งไซต์ได้ตามต้องการ

wget -r -m example.com

แต่คุณสมบัติที่ฉันกำลังมองหาคือคุณสามารถป้อนคำค้นหาเช่น "Linux" และค้นหาเว็บและดาวน์โหลดได้ มีโปรแกรมใน Ubuntu เช่นนี้หรือไม่?

คำตอบ:


4

คุณสามารถใช้ Google Alerts เพื่อสร้างหน้าเรียงลำดับการค้นหาที่ส่งไปยังฟีดจากนั้นใช้โปรแกรมอ่าน RSS หรือ Thunderbird เพื่ออ่าน

ฉันใช้ Thunderbird สำหรับ RSS ฉันไม่รู้ว่ามีผู้อ่าน RSS คนใดบ้างที่สามารถส่งออกฟีดไปเป็น html แบบง่าย


9

ให้ httrack (CLI) หรือ webhttrack (เว็บอินเตอร์เฟส) ยิงในเอกภพ repo ฉันไม่แน่ใจเกี่ยวกับคุณลักษณะคำค้นหาที่คุณอธิบาย แต่มีตัวเลือกที่กำหนดค่าได้อย่างง่ายดาย

http://packages.ubuntu.com/de/oneiric/webhttrack

เครื่องถ่ายเอกสารเว็บไซต์ HTTrack - เบราว์เซอร์ออฟไลน์ซอฟต์แวร์ฟรี (GNU GPL)


3

คุณสามารถลองhttp ripperได้

นี่คือคุณสมบัติบางอย่างที่โพสต์บนเว็บไซต์:

Free Software (GPL 3)
Generic (works with almost every website)
Runs on GNU/Linux and Windows
Nearly undetectable / blockable by servers
Built with python and pygtk

http://29a.ch/httpripper/screenshots/2.png หน้าจอยิง

ดูบทช่วยสอนจากผู้พัฒนา httpripper เอง:

  • httpripper.ogg

ลิ้งค์ดาวน์โหลด:

มันใช้งานได้สำหรับฉันภายใต้ Ubuntu 11.10 x64


-1

มีโมดูลที่เพียงพอที่ CPAN ของ Perl คุณเพียงแค่ต้องใช้สคริปต์ Perl เพียงเล็กน้อย

โดยเฉพาะอย่างยิ่งจะดูที่ WWW นี้: โมดูลใช้เครื่องจักรที่WWW: โมดูลใช้เครื่องจักร

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.