Seite parsen zum e-book downloaden

Dieses Thema Seite parsen zum e-book downloaden im Forum "Sonstiges rund ums Internet" wurde erstellt von ottolan, 5. Okt. 2004.

Thema: Seite parsen zum e-book downloaden Hallo Profs, ich will ein e-book downloaden. Das müßte ich bis in die dritte Ebene tun, allerdings sind auf der...

  1. Hallo Profs,
    ich will ein e-book downloaden. Das müßte ich bis in die dritte Ebene tun, allerdings sind auf der Startseite des e-books (Inhaltsangabe) diverse andere Linkbuttons, so daß der Download riesengroß werden würde. Ich hab schon versucht, mit LeechGet die Seite zu parsen, er erkennt aber nur 6 von mindestens 30 Links (die Kapitel des Buchs). GetRight erkennt zwar alle Links, aber wenn ich davon dann welche downloade, bekomme ich nur php-Dateien, mit denen ich nichts anfangen kann. Die entsprechenden Seiten werden nicht geladen. Man kann die zwar mit einem Editor aufmachen, sind dann aber scheiße zu lesen.
    Hat jemand eine Idee, wie ich da rangehen könnte ?
    Wie gesagt 3 Ebenen : Inhaltsverzeichnis --> Kapitel --> Zeichungen

    Danke schonmal
     
  2. Was du willst, ist eine Seite offline verfügbar machen.
    Ein e-book downloaden funktioniert mit dem klick auf den Downloadbutton wenn er denn vom Autor angeboten wird..
     
  3. Das ist mir schon klar. Dieser Button wird aber nicht angeboten. Ich könnte das Ding in ewiger Arbeit jetzt Seite für Seite (Kapitel für Kapitel bzw. Abbildung für Abbildung) speichernoder wie Du sagst, offline verfügbar machen. Auf den Seiten sind allerdings wieder Links, deren Ziele ich nicht mit speichern will.
    Und da muß es doch einen Weg geben. Parsen geht ja schonmal in die Richtung. LeechGet z.B. untersucht die angegebene Seite auf weiterführende Links, und man kann sich dann aussuchen, welche dieser Ziele dann gedownloadet werden sollen. Aber LeechGet erkennt irgendwie nicht alles.
    (muß jetzt erstmal weg, guck später wieder rein)
     
  4. vielleicht möchte der Autor genau das nicht haben, was Du machen willst?
     
  5. Hier mal der Link:

    http://www.trabiteam.de/ratgeber_Trabant/inhalt.php?lang=de

    Ist praktisch schon das Inhaltskapitel. Ich müßte diese Seite und noch 2 Ebenen tiefer saugen, aber wie man sieht, hat's auf dieser Seite schon wieder etliche andere Links, die ich nicht haben will.
    Hab mal die empfohlene Software geladen, aber nichts zum Aussortieren von Links entdeckt oder mich zu doof angestellt.
     
  6. Kannst Du nicht direkt dort anfragen?
     
  7. Das würde ich auch emphelen in Anbetracht des Copyright am Seitenende!
     
Die Seite wird geladen...

Seite parsen zum e-book downloaden - Ähnliche Themen

Forum Datum
Seitendarstellung fehlerhaft Windows 7 Forum 16. Feb. 2016
IE 11 zeigt keine Seiten an Web-Browser 9. Dez. 2015
Kamera "Rutscht" zur Seite in Spielen Windows 10 Forum 30. Juli 2015
Nach der Anmeldung nicht die Startseite zeigen Windows 10 Forum 4. Juni 2015
Fehler beim öffnen von https-Seiten Software: Empfehlungen, Gesuche & Problemlösungen 13. Mai 2015