Seite parsen zum e-book downloaden

  • #1
O

ottolan

Bekanntes Mitglied
Themenersteller
Dabei seit
18.01.2003
Beiträge
122
Reaktionspunkte
0
Hallo Profs,
ich will ein e-book downloaden. Das müßte ich bis in die dritte Ebene tun, allerdings sind auf der Startseite des e-books (Inhaltsangabe) diverse andere Linkbuttons, so daß der Download riesengroß werden würde. Ich hab schon versucht, mit LeechGet die Seite zu parsen, er erkennt aber nur 6 von mindestens 30 Links (die Kapitel des Buchs). GetRight erkennt zwar alle Links, aber wenn ich davon dann welche downloade, bekomme ich nur php-Dateien, mit denen ich nichts anfangen kann. Die entsprechenden Seiten werden nicht geladen. Man kann die zwar mit einem Editor aufmachen, sind dann aber scheiße zu lesen.
Hat jemand eine Idee, wie ich da rangehen könnte ?
Wie gesagt 3 Ebenen : Inhaltsverzeichnis --> Kapitel --> Zeichungen

Danke schonmal
 
  • #2
Was du willst, ist eine Seite offline verfügbar machen.
Ein e-book downloaden funktioniert mit dem klick auf den Downloadbutton wenn er denn vom Autor angeboten wird..
 
  • #3
Das ist mir schon klar. Dieser Button wird aber nicht angeboten. Ich könnte das Ding in ewiger Arbeit jetzt Seite für Seite (Kapitel für Kapitel bzw. Abbildung für Abbildung) speichernoder wie Du sagst, offline verfügbar machen. Auf den Seiten sind allerdings wieder Links, deren Ziele ich nicht mit speichern will.
Und da muß es doch einen Weg geben. Parsen geht ja schonmal in die Richtung. LeechGet z.B. untersucht die angegebene Seite auf weiterführende Links, und man kann sich dann aussuchen, welche dieser Ziele dann gedownloadet werden sollen. Aber LeechGet erkennt irgendwie nicht alles.
(muß jetzt erstmal weg, guck später wieder rein)
 
  • #6
Hier mal der Link:



Ist praktisch schon das Inhaltskapitel. Ich müßte diese Seite und noch 2 Ebenen tiefer saugen, aber wie man sieht, hat's auf dieser Seite schon wieder etliche andere Links, die ich nicht haben will.
Hab mal die empfohlene Software geladen, aber nichts zum Aussortieren von Links entdeckt oder mich zu doof angestellt.
 
  • #7
Kannst Du nicht direkt dort anfragen?
 
  • #8
aninemo schrieb:
Kannst Du nicht direkt dort anfragen?

Das würde ich auch emphelen in Anbetracht des Copyright am Seitenende!
 
Thema:

Seite parsen zum e-book downloaden

ANGEBOTE & SPONSOREN

Statistik des Forums

Themen
113.840
Beiträge
707.963
Mitglieder
51.494
Neuestes Mitglied
Flensburg45
Oben