Automatische Analyse geowissenschaftlicher Datensätze

Das Bundesamt für Energie (BFE) und das Bundesamt für Landestopografie (swisstopo) fördern im Rahmen Energiestrategie 2050 die Exploration von Geothermie. Während den Prospektions- und Explorationsphasen von Geothermie-Projekte werden unterschiedliche geowissenschaftlicher Daten produziert, welche von der swisstopo (Landesgeologie) gespeichert und der Öffentlichkeit zur Verfügung gestellt werden. In diesem Kontext entwickelten wir in unserem Projekt (2019-2022) Methoden und Algorithmen zur (semi-) automatischen Erfassung, Analyse und Auswertung geologischer und geophysikalischer Datensätze.
Wir fokussierten uns auf vorhandene geowissenschaftliche Daten der Landesgeologie. Es existiert bereits ein grosses Inventar an geologischen Berichten und Daten, welche hauptsächlich als PDF-Dokumente archiviert sind und wesentliche Informationen über den Schweizer Untergrund enthalten. Hierbei konzentrierten wir uns deshalb auf das gezielte Abrufen und Extrahieren von Informationen ausgehend von diesen Berichten. Auf der Grundlage des existierenden und stetig wachsenden Archivinventars haben wir einen Workflow aufgebaut, der auf die Abfrage geologischer Begriffe zugeschnitten ist. In diesem Prozess werden semantisch ähnliche Berichte mit Hilfe von Natural Language Processing Methoden in geowissenschaftliche Klassen eingeteilt. Parallel dazu werden geologische Elemente wie Bohrprofile, Karten und Abbildungen mittels Computer Vision Methoden automatisch identifiziert und extrahiert und können so für die weitere Digitalisierung und Aufbereitung separat gespeichert werden [Morgenthaler et al. 2022] (Fig 1).
Zudem befassten wir uns auch mit der Erschliessung des Archivs der Landesgeologie für alle Nutzenden. Hierfür haben wir den Archivinhalt in eine Geodateninfrastruktur auf der Cloud überführt und prozessierten die Archivdaten mit den Machine Learning Algorithmen. Dazu entwickelten wir eine moderne Such- und Managementplattform, welche es Nutzern erlaubt auf das komplette Archiv über Volltext-, Karten-, Objekt- oder thematischen Suche zuzugreifen (Fig 2).

Fig. 1: Übersicht über die Analyse von Text und Bild mittels Texterkennung, Textklassifizierung und Objekterkennung und Überführung in die Geodateninfrastruktur.
Fig. 2: Bildschirmdesigns und Funktionalitäten der Such- und Managementplattform.