Hallo. Schön, dass du da bist.
Die hier gehosteten Digilabs stehen als standalone-fähige Quellcodepakete über die jeweiligen Bitbucket-Links zur Verfügung und können frei geklont, geteilt, bearbeitet, verwendet, gegessen, präsentiert, neu entworfen, bestaunt und/oder sonstwie be- um- an- hoch- und runtergezogen werden.
Statistik

Hier entsteht ein Digilab für allgemeine statistische Analysen. Die Theorie folgt einer Statistikvorlesung auf Basis von Andy Fields Lehrbuch. Die natürlich vollkommen fehlerfrei ausgearbeitete Vorlesung entstand an der Abteilung für Computational Humanities der Uni Leipzig und steht in Form von Folien und Videos zur Verfügung.
Damit soll ein Gesamtpaket erstellt werden, welches eine autodidaktische Statistikausbildung ermöglicht und grundlegende statistische Verfahren niedrigschwellig zur Verfügung stellt.
Die Georeferenzierungs-werkzeugsammlung


Es ist unangenehm, dass man bei Georeferenzierung viele Klicks für einfache Arbeiten benötigt, dabei am besten noch Popups wegklicken und herumscrollen muss und durch die Werkzeugnutzung von Firmen wie Microsoft und Google die eigenen Forschungsdaten in irgendwelchen immer cloudbasierter werdenden Prozessen gesammelt werden.
Hier entstehen ein paar rein client-seitig arbeitende OpenSource Werkzeuge, die auf georeferenziertes Forschungshandwerk ausgerichtet sind. Aktuell gibt es Tools für Koordinatenrecherche & Polygonerstellung per Klick, Kartenpins & Chloroplethkarten per Zahleneingabe und Datenabfrage zur Registerdatenbank des Sorbischen Instituts. Verfügbare Kartenlayer beinhalten globale und – für Deutschland – regionale Karten verschiedener Granularitätsebenen.
Es wird nichts geloggt und alles passiert im persönlichen Browser. Die Kartenlayer und Ortsuche werden von OSM abgefragt. Der Quellcode ist in sich geschlossen und kann selbst gehostet werden.
Canonical Text Service Reloaded

Die Pretree-basierte CTS Implementierung wird hier von ihrem etwas unglücklich gewähltem JAVA Korsett befreit und nochmal frisch in PHP programmiert. Ergänzt wird der Webservice von diversen Werkzeugen und Funktionen, die die technischen Vorteile des CTS Protokoll besser ausschöpfen und einerseits die Nutzung des Service komfortabler machen – beispielsweise durch eine Python API oder Metadatenabfragen – sowie andererseits generische Text Mining Analysen ermöglichen. Gleichzeitig werden dabei Textkorpora gesammelt und archiviert.
Das Projekt wird als extern gehosteter Webservice (urncts.eu) umgesetzt.
DSB Wortschatzportal

Der niedersorbische Textkorpus des Sorbischen Instituts (Niederlassung Cottbus) spiegelt das gesamte verschriftliche Wissen über die niedersorbische Sprache wider und formt damit ein wunderbar praktisches Fallbeispiel für die Entwicklung des Canonical Text Miners (CTM).
Im Laufe der Arbeit werden diverse Text Mining Analysen generisch implementiert und in einem Digilab gesammelt. Der CTM wird dann zukünftig – neben CTS – das zweite Standbein der Canonical Text Infrastructure bilden.
WhataboutHanna


Bevor Twitter zu X (ehemals Twitter) mutierte, existierte eine Abfrageschnittstelle, über die Twitterdaten zu Forschungszwecken gecrawlt werden konnten. Diese Schnittstelle wurde genutzt, um die Diskussion zum Thema prekärer Arbeitsverhältnisse im Wissenschaftsbetrieb quantitativ zu analysieren. Tweets zu den Hashtags #ichBinHanna #ichBinReyan, #wisszeitvg und #dauerstellen wurden gecrawlt und darauf aufbauende Analysen in diesem Digilab datenschutzkonform aufbereitet und bereitgestellt.
Aufgrund der „moderneren“ Ausrichtung von X (ehemals aber umgangssprachlich immernoch und irgendwie wohl für immer Twitter) wird es wohl eine der aktuellsten und einzigen frei zugänglichen quantitativen Twitteranalysen bleiben.
MDR Corona Ticker Text Mining

Während der Coronapandemie entstand ein hoher Bedarf an schnell vermittelten Nachrichten. Dabei wurden von diversen öffentlich-rechtlichen Nachrichtenseiten Coronaticker geführt. Diese Coronaticker bilden rückblickend ein sehr feingranulares Archiv von Geschehnissen ab und sind damit eine nicht zu unterschätzende Wissensquelle über die Pandemie für die Nachwelt.
Dieses Digilab enthält Text Mining Analysen sowie die Nachrichteninhalte zum MDR Coronaticker – eine Forschungsarbeit, die am Hannah-Arendt-Institut für Totalitarismusforschung (Dresden) entstanden ist. Bilddaten wurden dabei aus Urheberrechtsgründen nicht inkludiert.