Das Internet Archive (IA) archiviert seit 25 Jahren große Teile des globalen Webs. Dieser historische Datensatz bietet einen unvergleichlichen Einblick in die Entwicklung des Internets im Laufe der Zeit. Ein Teil dieser Sammeltätigkeit bestand darin, die Analyse dieses enormen Datensatzes durch groß angelegte rechnergestützte Forschungsarbeiten zu unterstützen.
Web-Archive geben uns die Möglichkeit, das Web wie einen Datensatz zu verarbeiten, der sowohl zeitlich als auch rückwirkend durchsucht, analysiert und untersucht werden kann. Unsere technischen Bemühungen zielen auf die sehr spezifischen Eigenschaften des archivierten Webs für unsere interdisziplinären Nutzende und Partner:innen ab, indem wir die gesamte Komplexität ausblenden und von technischen Details abstrahieren.
In diesem Vortrag werden verschiedene Perspektiven auf die computergestützte Erforschung archivierter Webdaten, technische Herausforderungen, neue Entwicklungen und Möglichkeiten sowie Überlegungen, die bei der Arbeit mit diesem einzigartigen Datensatz angestellt werden müssen, dargelegt.