Ich möchte komplette Webseiten aus dem Netz speichern. Hab gehört web scraping ist eine Möglichkeit, wie geht so etwas?


Wer Informationen von Webseiten speichern möchte, kann dies mit viel Aufwand manuell tun. Mit Web Scraping hat man jedoch die Möglichkeit, die Daten und Informationen automatisch zu finden und weiterzuverarbeiten.

Wer sich heutzutage auf der Suche nach Informationen befindet, der nutzt dafür fast immer das Internet. Die Informationen, die hier auf unzähligen Internetseiten bereit gestellt, zum Beispiel Preise, Abflugzeiten oder andere Daten, werden, zumeist privat, aber auch für geschäftliche Zwecke verwendet. Nun gibt es aber auch Personen, die die Informationen der Webseiten speichern und weiterverwenden möchten. Mit Hilfe des so genannten Web Scrapings ist das möglich. Beim Web Scrapin werden die gesuchten Informationen aus den Daten der jeweiligen Webseiten ausgelesen und können dann weiterverwendet werden. Wer fremde Webseiten speichern, oder bestimmte Daten daraus extrahieren und verwenden möchte, der sollte sich zuvor über die rechtlichen Bestimmungen informieren. Denn das Web Scraping, oder das Verwenden fremder Inhalte, wird von den Betreibern einer Webseite nicht immer billigend in Kauf genommen.

Antworten

3 Antworten:

Kommentar von Elke

Ich weiß zwar nicht, wie das ist, wenn du komplette Webseiten speichern willst, aber wenn du das netz nur nach bestimmten Daten durchforsten willst, dann brauchst du einen web crawler, der das für dich übernimmt, aber nur, wenn die seiten das zulassen.

Kommentar von sebo

Also ich bin mir nicht sicher, ob das nicht irgendwie illegal ist, wenn du was von Webseiten speichern willst. Zumindest wenn es darum geht, personenbezogene Daten zu speichern. Wenn es nur darum geht, irgendwelche Statistiken zu erstellen, denke ich aber, dass das kein Problem ist.

Kommentar von Jana

Das ist mit verschiedenen Programmen möglich. Bevor du was von anderen Webseiten speichern tust, solltest du dich aber über die Rechtslage informieren, denn nicht jeder Webseitenbetreiber ist damit einverstanden, dass seine Daten einfach kopiert und anderweitig verwendet werden.

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *