In den Computational Humanities verwenden wir Techniken und Methoden des Text Mining und des Natural Language Processing sowie der Audio-, Video- und Bildanalyse, um große Kollektionen geistes- und sozialwissenschaftlicher Daten zu untersuchen. Darüber hinaus ist uns eine theoretische Fundierung und methodische Reflexion des Vorgehens wichtig, um so mehr über die epistemologischen Rahmenbedingungen und Konsequenzen von computergestützten Forschungspraktiken in den Geistes- und Sozialwissenschaften zu erfahren.

Aktuelle Drittmittelprojekte

Im Rahmen des BMBF-geförderten Projekts "FakeNarratives – Narrative der Desinformation verstehen: ein Vergleich zwischen öffentlich-rechtlichen und alternativen Nachrichtenvideos" verwenden wir Distant-Viewing-Methoden, um die zugrundeliegenden Strukturen von Narrativen der Desinformation zu analysieren. Weitere Informationen finden Sie auf der Infoseite des BMBF sowie der ProjektwebsiteDas Projekt ist Teil unseres Forschungsschwerpunkts "Distant Viewing & Video Analytics".

Publikationen:

  • Tseng, Chiao-I, Liebl, Bernhard, Burghardt, Manuel & Bateman, John (erscheint 2023). FakeNarratives – First Forays in Understanding Narratives of Disinformation in Public and Alternative News Videos. In: Proceedings of the DHd Conference 2023, Luxemburg/Trier.
  • Liebl, Bernhard & Burghardt, Manuel (im Review). Zoetrope – Interactive Feature Exploration in News Videos. In: Proceedings of the ADHO Conference on Digital Humanities, Graz.
  • Bateman, John, Tseng, Chiao-I & Burghardt, Manuel (im Review). Narrative Strukturen als Mittel der indirekten Kritik in der audiovisuellen Nachrichtenberichterstattung. Sammelband "Textualität des Films".

Im seit 2019 laufenden Projekt "More than a Feeling: Media Sentiment as a Mirror of Investors’ Expectations at the Berlin Stock Exchange, 1872-1930" setzen wir verschiedene Verfahren aus dem Bereich des Deep Learning ein, um einerseits OCR und Layout Detection und andererseits Text Mining und Sentiment Analyse für eine historische, deutsche Börsenzeitung umzusetzen. Nähere Informationen hierzu finden Sie im zugehörigen DFG-Gepris-Eintrag sowie auf der Projektwebsite. Das Projekt ist Teil unseres Forschungsschwerpunkts "Text Mining und Natural Language Processing".

Publikationen:

  • Janos Borst, Lino Wehrheim, Manuel Burghardt (im Review): “Money Can’t Buy Love?” Creating a Historical Sentiment Index for the Berlin Stock Exchange, 1872–1930. In: Proceedings of the ADHO Conference on Digital Humanities, Graz.
  • Lino Wehrheim, Janos Borst, Manuel Burghardt & Andreas Niekler (erscheint 2023): „Auch heute war die Stimmung im Allgemeinen fest.“ Zero-Shot Klassifikation zur Bestimmung des Media Sentiment an der Berliner Börse zwischen 1872 und 1930. In: Proceedings of the DHd 2023, Luxemburg/Trier.
  • Lino Wehrheim, Bernhard Liebl, Manuel Burghardt (2022): Extracting Textual Data from Historical Newspaper Scans and its Challenges for “Guerilla-Projects”. In: Regensburg Economic and Social History (RESH) Discussion Paper Series.
  • Lino Wehrheim, Bernhard Liebl (2020): What’s in the news? (Erfolgs-)Rezepte für das wissenschaftliche Arbeiten mit digitalisierten Zeitungen. In: Schöch, Christof (Hrsg.) DHd 2020 Spielräume: Digital Humanities zwischen Modellierung und Interpretation. Konferenzabstracts, pp. 70–72.
  • Liebl, B. & Burghardt, M. (2020). From Historical Newspapers to Machine-Readable Data: The Origami OCR Pipeline. Proceedings of the 1st Workshop on Computational Humanities Research (CHR).
  • Liebl, B. & Burghardt, M. (2020). An Evaluation of DNN Architectures for Page Segmentation of Historical Newspapers. 25th International Conference on Pattern Recognition, Mailand. (Preprint https://arxiv.org/abs/2004.07317)

Forschungsschwerpunkte

Einen Schwerpunkt unserer Forschung bilden Distant Viewing & Video Analytics, also die computergestützten Analyse von Nachrichtenvideos, Filmen und Serien.

Publikationen:

  • Luhmann, J., Burghardt, M. & Tiepmar, J. (2020). SubRosa: Determining Movie Similarities based on Subtitles. 3. InfDH-Workshop “Methoden und Anwendungen der Computational Humanities”, INFORMATIK 2020 Workshops, Lecture Notes in Informatics (LNI), Karlsruhe.
  • Luhmann, J., Burghardt, M. & Tiepmar, J. (2020). SubRosa – Multi-Feature-Ähnlichkeitsvergleiche von Untertiteln. Book of Abstracts, DHd 2020, Paderborn.
  • Burghardt, M., Heftberger, A., Pause, J., Walkowski, N., & Zeppelzauer, M. (2020). Film and Video Analysis in the Digital Humanities – An Interdisciplinary Dialog. Special Issue for Digital Humanities Quarterly, 14(4).
  • Burghardt, M., Pause, J. & Walkowski, N.-O. (2019). Scalable Viewing in den Filmwissenschaften. In Book of Abstracts, DHd 2019.
  • Burghardt, M., Meyer, S., Schmidtbauer, S. & Molz, J. (2019). “The Bard meets the Doctor” – Computergestützte Identifikation intertextueller Shakespearebezüge in der Science Fiction-Serie Dr. Who. In Book of Abstracts, DHd 2019.
  • Burghardt, M., Kao, M. & Walkowski, NO (2018). Scalable MovieBarcodes – An Exploratory Interface for the Analysis of Movies. 3rd IEEE VIS Workshop on Visualization for the Digital Humanities, Berlin.
  • Burghardt, M., Hafner, K. Edel, L., Kenaan, S. & Wolff, C. (2017). An Information System for the Analysis of Color Distributions in MovieBarcodes. In Proceedings of the 15th International Symposium of Information Science (ISI 2017).
  • Burghardt, M., Kao, M. & Wolff, C. (2016). Beyond Shot Lengths – Using Language Data and Color Information as Additional Parameters for Quantitative Movie Analysis. In Book of Abstracts of the International Digital Humanities Conference (DH).
  • Burghardt, M. & Wolff, C. (2016). Digital Humanities in Bewegung: Ansätze für die computergestützte Filmanalyse. In Book of Abstracts, DHd 2016.

Im Bereich der Digital Environmental Humanities verfolgen wir interdisziplinären Ansätze zur Verzahnung von Fragestellungen und Methoden aus der Literaturwissenschaft und der Biodiversitätsforschung. Dabei kommen Methoden aus den Bereichen NLP und IR zum Einsatz.

Publikationen:

  • Langer, Lars, Burghardt, Manuel, Borgards, Roland, Köhring, Esther & Wirth, Christian (2022). Digital Environmental Humanities – Zum Potential von „Computational and Literary Biodiversity Studies“ (CoLiBiS). In Book of Abstracts of the “Digital Humanities im deutschsprachigen Raum” (DHd) Conference, Potsdam.
  • Langer, L., Burghardt, M., Borgards, R., Böhning-Gaese, K., Seppelt, R. & Wirth, C. (2021). The rise and fall of awareness for biodiversity – A comprehensive quantification of historical changes in the use of vernacular labels for biological taxa in Western creative literature”. In People and Nature

Unsere Forschung in den DH Scientometrics & Theory of DH widmet sich der Vermessung von disziplinären Grenzen und akademischen Forschungspraktiken sowie deren theoretischer Fundamente, insbesondere in den Digital und Computational Humanities.

Publikationen:

  • Ruth, Nicolas, Niekler, Andreas & Burghardt, Manuel (2022). Peeking Inside the DH Toolbox – Detection and Classification of Software Tools in DH Publications. In: Proceedings of the CHR Conference 2022.
  • Kleymann, Rabea, Niekler, Andreas & Burghardt, Manuel (2022). Conceptual Forays: A Corpus-based Study of “Theory” in Digital Humanities Journals. In Journal of Cultural Analytics.
  • Gutiérrez De la Torre, Silvia E., Equihua, Julián, Niekler, Andreas & Burghardt, Manuel (2022). Into the bibliography jungle: using random forests to predict dissertations’ reference section. Proceedings of the Workshop on Understanding LIterature references in academic full TExt (ULITE), co-located with ACM/IEEE Joint Conference on Digital Libraries 2022.Walkowski, Niels-Oliver & Burghardt, Manuel (2022). Executable Papers in den Computational Humanities. In Book of Abstracts of the “Digital Humanities im deutschsprachigen Raum” (DHd) Conference, Potsdam.
  • Kleymann, Rabea, Niekler, Andreas & Burghardt, Manuel (2022). Conceptual Forays: A Corpus-based Study of “Theory” in Digital Humanities Journals. In Journal of Cultural Analytics.
  • Burghardt, Manuel, Luhmann, Jan & Niekler, Andreas (2022). Tools as Epistemologies in DH? A Corpus-Based Exploration. In Book of Abstracts of the ADHO Conference on Digital Humanities, Tokyo.
  • Gutiérrez, Silvia, Kleymann, Rabea, Niekler, Andreas & Burghardt, Manuel (2022). The many faces of theory in DH. In Book of Abstracts of the ADHO Conference on Digital Humanities, Tokyo.
  • Luhmann, J. & Burghardt, M. (erscheint 2021). Digital Humanities – A Discipline in its Own Right? An Analysis of the Role and Position of DH in the Academic Landscape. In Journal of the Association for Information Science and Technology (JASIST), Special issue on Digital Humanities.
  • Burghard, M. & Luhmann, J. (2021). Same same, but different? On the Relation of   Information Science and the Digital Humanities. A Scientometric Comparison of Academic Journals Using LDA and Hierarchical Clustering. In Proceedings of the 16th International Symposium of Information Science (ISI2021): “Information between Data and Knowledge – Information Science and its Neighbors from Data Science to Digital Humanities”.

Text Mining und Natural Language Processing haben eine lange Tradition in den Digital Humanities. Unser Interesse in diesem Bereich gilt insbesondere aktuellen Methoden aus den Bereichen text reuse detection, text similarity und sentiment analysis.

Publikationen:

  • Liebl, Bernhard & Burghardt, Manuel (2022). The Vectorian API – A Research Framework for Semantic Textual Similarity (STS) Searches. In Book of Abstracts of the ADHO Conference on Digital Humanities, Tokyo.
  • Liebl, Bernhard & Burghardt, Manuel (2022). “Embed, embed! There’s knocking at the gate.” Detecting Intertextuality with Embeddings and the Vectorian. In “Fabrikation von Erkenntnis – Experimente in den Digital Humanities”, edited by Manuel Burghardt, Lisa Dieckmann, Timo Steyer, Peer Trilcke, Niels-Oliver Walkowski, Joëlle Weis & Ulrike Wuttke. Melusina Press.
  • Akiki, C. & Burghardt, M. (2020). Toward a Musical Sentiment (MuSe) Dataset for Affective Distant Hearing. Proceedings of the 1st Workshop on Computational Humanities Research (CHR).
  • Bryan, M., Burghardt, M. & Molz, J. (2020). A Computational Expedition into the Undiscovered Country - Evaluating Neural Networks for the Identification of Hamlet Text Reuse. Proceedings of the 1st Workshop on Computational Humanities Research (CHR).
  • Liebl, B. & Burghardt, M. (2020). “Shakespeare in The Vectorian Age” – An Evaluation of Different Word Embeddings and NLP Parameters for the Detection of Shakespeare Quotes”. Proceedings of the 4th Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature (LateCH), co-located with COLING’2020.
  • Liebl, B. & Burghardt, M. (2020). „The Vectorian“ – Eine parametrisierbare Suchmaschine für intertextuelle Referenzen. Book of Abstracts, DHd 2020, Paderborn.
  • Schröder, C., Müller, L., Niekler, A., & Potthast, M. (2021). Small-text: Active Learning for Text Classification in Python. arXiv:2107.10314 [cs].
  • Borst, J., Wencker, T., & Niekler, A. (2022). Using Text Classification with a Bayesian Correction for Estimating Overreporting in the Creditor Reporting System on Climate Adaptation Finance.

Die Immersive & Interactive Humanities untersuchen den Einsatz von AR/VR/XR, Eyetracking, Tangible Interfaces und anderen HCI-Technologien für die Digital Humanities.

Publikationen:

  • Piontkowitz, Vera & Burghardt, Manuel (2021). Best Practices für die Gestaltung virtueller Museumsräume. In „Fabrikation von Erkenntnis – Experimente in den Digital Humanities“, edited by Manuel Burghardt, Lisa Dieckmann, Timo Steyer, Peer Trilcke, Niels Walkowski, Joëlle Weis, Ulrike Wuttke. Wolfenbüttel 2021. (= Zeitschrift für digitale Geisteswissenschaften / Sonderbände, 5) (https://zfdg.de/sb005_005)
  • Schwappach, F. & Burghardt, M. (2019). Augmentierte Notizbücher und Natürliche Interaktion – Unterstützung der Kulturtechnik Handschrift in einer digitalen Forschungswelt. Book of Abstracts, DHd 2019.
  • Dechant, M. & Burghardt, M. (2015). Virtuelle Rekonstruktion des Regensburger Ballhauses. In Book of Abstracts, DHd 2015.
  • Haas, B., Kautetzky, M., Voit, M., Burghardt, M. & Wolff, C. (2015). ResearchSherlock: Toward a seamless integration of printed books into the digital academic workflow. In Proceedings of the 14th International Symposium of Information Science (ISI 2015).
  • Bazo, A., Burghardt, M. & Wolff, C. (2013). Virtual Bookshelf – Ein Natural User Interface zur Organisation und Exploration digitaler Dokumente. In Proceedings of the 13th International Symposium of Information Science.

Die Computational Game Studies, d.h. die Erforschung von (Video-)Spielen mit computergestützten Methoden, stellt ein vergleichsweise junges Forschungsfeld dar. Unser Fokus liegt hier besonders auf Methoden zur empirischen, multimodalen Analyse von Videospielen.

Publikationen:

  • Burghardt, M. & Tiepmar, J. (2021). The Game Walkthrough Corpus (GWTC) – A Resource for the Analysis of Textual Game Descriptions. In Journal of Open Humanities Data.

Die Computational Spatial Humanities befassen sich mit der computergestützten Auswertung raumbezogener Daten im Kontext geisteswissenschaftlicher Fragestellungen.

Computational Social Science (CSS) ist ein interdisziplinäres Gebiet, das in erster Linie computergestützte Methoden verwendet, um Theorien über menschliches Verhalten in den Sozialwissenschaften, der Psychologie und der Wirtschaft zu entwickeln und zu testen. Diese Methoden werden auf große Datensätze über menschliches Verhalten angewandt, wie sie in sozialen Medien oder digitalen Archiven zu finden sind, und beinhalten oft die Verwendung von Big Data. CSS umfasst jedoch auch Textanalysen und Simulationen.

In unserer Gruppe setzen wir uns vor allem mit der Analyse von Inhalten auseinander und kooperieren mit den Kommunikations- und Medienwissenschaften, Politikwissenschaften und der Verhaltensforschung am Standort Leipzig.

Publikationen:

  • Wiedemann, G., & Niekler, A. (2017). Hands-On: A Five Day Text Mining Course for Humanists and Social Scientists in R. Proceedings of the Workshop on Teaching NLP for Digital Humanities (Teach4DH) 2017, Berlin, Germany, September 12, 2017., 57–65.

  • Maier, D., Waldherr, A., Miltner, P., Wiedemann, G., Niekler, A., Keinert, A., Pfetsch, B., Heyer, G., Reber, U., Häussler, T., Schmid-Petri, H., & Adam, S. (2018). Applying LDA Topic Modeling in Communication Research: Toward a Valid and Reliable Methodology. Communication Methods and Measures, 12(2–3), 93–118.

  • Maier, D., Niekler, A., Wiedemann, G., & Stoltenberg, D. (2020). How Document Sampling and Vocabulary Pruning Affect the Results of Topic Models. In Computational Communication Research (Bd. 2, Nummer 2, S. 139–152). Amsterdam University Press.

  • Niekler, A. (2018). Automatisierte Verfahren für die Themenanalyse nachrichtenorientierter Textquellen. Herbert von Halem Verlag.

  • Niekler, A., Bleier, A., Kahmann, C., Posch, L., Wiedemann, G., Erdogan, K., Heyer, G., & Strohmaier, M. (2018). ILCM – A Virtual Research Infrastructure for Large-Scale Qualitative Data. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). European Language Resources Association (ELRA).