Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/wanjage/charles-burney-digital
Digitale Aufbereitung, Anreicherung und Geovisualisierung eines Reiseberichts des Musikhistorikers Charles Burney, mithilfe von Transkribus, Spacy-NER und Nodegoat
https://github.com/wanjage/charles-burney-digital
geovisualisierung ner nlp nodegoat reisebericht spacy
Last synced: about 1 month ago
JSON representation
Digitale Aufbereitung, Anreicherung und Geovisualisierung eines Reiseberichts des Musikhistorikers Charles Burney, mithilfe von Transkribus, Spacy-NER und Nodegoat
- Host: GitHub
- URL: https://github.com/wanjage/charles-burney-digital
- Owner: WanjaGe
- License: epl-2.0
- Created: 2024-06-18T19:56:54.000Z (7 months ago)
- Default Branch: main
- Last Pushed: 2024-07-29T06:18:51.000Z (6 months ago)
- Last Synced: 2024-12-18T18:12:59.969Z (about 1 month ago)
- Topics: geovisualisierung, ner, nlp, nodegoat, reisebericht, spacy
- Language: Jupyter Notebook
- Homepage:
- Size: 3.63 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
- Citation: CITATION.cff
Awesome Lists containing this project
README
# Projekt
Die in diesem Repository verfügbaren Daten entstanden im Rahmen der Übung "Grand Tour gone Digital". Diese Lehrveranstaltung wurde von Dr. Ina Serif im Frühjahrsemester 2024 an der Universität Basel durchgeführt.
# Zielsetzung
Ziel des hier vorliegenden Projektes ist es, den Reisebericht *The Present State of Music in France and Italy* (1771) von Charles Burney digital aufzubereiten, anzureichern und zu visualisieren. Dies beinhaltet die Transkription des gedruckten Textes zur Erstellung eines Volltextes, das Trainieren und die Anwendung eines Named Entity Recognition-Modells mit **SpaCy**, sowie die Geovisualisierung mit dem Tool **Nodegoat**. Das Repository enthät eine schriftliche Dokumentation des Projektes, sowie jegliche Python-Skripte, welche zur Durchführung der NER verwendet wurden. Ebenfalls stehen die genutzten Datensets zur Verfügung. Der genutzte Drucktext ist verfügbar vie Cambridge Core (https://doi.org/10.1017/CBO9781107589339).