archive.today

archive.today[1] ist ein Online-Dienst, der unter verschiedenen Top-Level-Domains komplette Webseiten mit Bildern, Stylesheets, Schriften und Werbeanzeigen auf Wunsch bzw. automatisch archiviert, wenn sie z. B. in der Wikipedia verlinkt werden. Dabei wird eine URL bestehend aus einem Zeitstempel und der Original-URL angelegt. Zusätzlich wird eine Kurz-URL als Weiterleitung generiert, die ebenfalls als Hyperlink genutzt werden kann.[2] Lesern wird ermöglicht, auf ein Memento einer Webseite zuzugreifen, das über die Zeit unverändert dargestellt wird.

Der Dienst betreibt weitere Domains in verschiedenen Ländern, bekannt sind archive.ph[3] (Philippinen), archive.is[4] (Island), archive.md[5] (Moldau), archive.fo[6] (Färöer), archive.li[7] (Liechtenstein) und archive.vn[8] (Vietnam) und wechselt das Host-Land der Domains, auf welches weitergeleitet wird, immer mal wieder.[9] Aktuell (seit 2021[10] oder früher) wird auf archive.ph weitergeleitet.[11]

Beschreibung

Ursprünglich wurde archive.today ausschließlich aus Mitteln der Gründer finanziert. Die Nettokosten für die Server wurden im Jahr 2016 mit rund 3.500–4.000 US$ pro Monat beziffert.[12] Seit November 2016 wird um Spenden geworben.[13] Vor dem Spendenaufruf gab es mehrere DoS-Attacken und die Notwendigkeit, die Domain durch Cloudflare schützen zu lassen.[14]

archive.today kann im Gegensatz zu WebCite dynamisch erzeugte Webseiten speichern (von z. B. Websites wie Twitter oder Wikimapia),[2] speichert aber Video-, PDF- und Flash-Inhalte nicht. Das Memento-Protokoll wird unterstützt.[15]

Opt-out- oder Opt-in-Funktionen, z. B. mittels robots.txt oder HTML-meta-robots-Tag, werden nicht angeboten.[16][17] Nach Aussagen der Betreiber können Inhalte gelöscht werden, die den Geschäftsbedingungen des Webhosters von archive.today widersprechen (bspw. Pornografie).[16][18]

Die Kopien auf archive.today sind für Suchmaschinen nicht gesperrt und erscheinen somit in deren Index. Techniken wie der Robots Exclusion Standard und das Meta-Element noindex, die das Indexieren von Webseiten verhindern, werden auf diese Weise unterlaufen.

Die Betreiber des Dienstes wollen anonym bleiben und veröffentlichen weder Impressum noch andere Daten zu ihrer Identität. Nach eigener Aussage aus dem Jahr 2013 waren sie damals ein kleines Team, bestehend aus einigen wenigen Personen.[19]

Siehe auch

Weblinks

Einzelnachweise

  1. Website archive.today (Memento vom 23. Juli 2014 im Internet Archive) (englisch)
  2. a b Michael L. Nelson: archive.is Supports Memento. Web Science and Digital Libraries Research Group, Old Dominion University, 9. Juli 2013, abgerufen am 6. November 2013 (englisch).
  3. Website archive.ph abgerufen am 11. April 2023
  4. Website archive.is abgerufen am 11. April 2023
  5. Website archive.md abgerufen am 11. April 2023
  6. Website archive.fo abgerufen am 11. April 2023
  7. Website archive.li abgerufen am 11. April 2023
  8. Website archive.vn abgerufen am 11. April 2023
  9. Do you plan to stick with the new archive-dot-today domain long-term? ... In: archive.is blog. 25. April 2014 (englisch).
  10. archive.today. Archiviert vom Original am 16. April 2021; abgerufen am 12. April 2023.
  11. Website archive.today abgerufen am 12. April 2023
  12. How do you guys keep the lights on? ... In: archive.is blog. 8. Oktober 2016, abgerufen am 3. Januar 2023 (englisch).
  13. How can I donate? In: archive.is blog. 23. Oktober 2016, abgerufen am 3. Januar 2023 (englisch).
  14. Cloudflare Javascript loop page when trying to access archive-dot-is from the Tor network. In: archive.is blog. 6. Oktober 2016, abgerufen am 3. Januar 2023 (englisch).
  15. archive.is. In: Memento Framework. Abgerufen am 1. November 2013 (englisch).
  16. a b FAQ. In: archive.today. Abgerufen am 21. Januar 2019 (englisch).
  17. Can your spider be stopped. In: archive.is blog. 16. Juni 2013, abgerufen am 3. Januar 2023 (englisch).
  18. How long my snapshot will be stored? In: archive.is blog. 28. Dezember 2012, abgerufen am 3. Januar 2023 (englisch).
  19. „Two persons, currently.“ In: archive.is blog vom 4. August 2013 (englisch).