https://github.com/343max/grimm-repo
Script zum Generieren eines git Repositories mit allen Auflagen der Grimm'schen Märchen
https://github.com/343max/grimm-repo
Last synced: 12 months ago
JSON representation
Script zum Generieren eines git Repositories mit allen Auflagen der Grimm'schen Märchen
- Host: GitHub
- URL: https://github.com/343max/grimm-repo
- Owner: 343max
- Created: 2010-12-12T13:26:15.000Z (over 15 years ago)
- Default Branch: master
- Last Pushed: 2010-12-12T13:28:08.000Z (over 15 years ago)
- Last Synced: 2024-04-14T14:21:11.421Z (almost 2 years ago)
- Language: PHP
- Homepage: märchenstunde.net
- Size: 4.81 MB
- Stars: 5
- Watchers: 4
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README
Awesome Lists containing this project
README
Grimm Repository
Dies ist eine Scriptsammlung, die ein git-Repository mit allen Auflagen der Grimm'schen "Kinder- und Hausmärchen" http://de.wikisource.org/wiki/Kinder-_und_Hausm%C3%A4rchen erstellt. Mithilfe dieses Repositories kann man dann die einzelnen Auflagen der Märchen recht komfortabel mit geeigneten Werkzeugen vergleichen und sich Unterschiede hervorheben zu lassen. Dazu werden die einzelnen Märchen aus wikisource heruntergeladen. Für jede Auflage gibt es einen Commit ins Repository.
So gehts:
Märchen aus der Wikipedia herunterladen:
sh get_maerchen.sh
legt einen Ordner "maerchen_source" an, in dem der 1:1 HTML Quelltext aller Märchen aus Wikisources liegt.
php generate_book.php
legt im Ordner "book" ein leeres Repository an, kopiert jedes Märchen der jeweiligen Auflage hinein, und führt ein git-commit mit Auflagennummer und Jahreszahl durch. Im Ergebnis hat man 8 Commits: 2 für die erste Auflage, gentrennt nach den Jahren 1812 und 1815 sowie einen weiteren Commit für jede weitere Auflage.
Bugs:
- zwischen den einzelnen Auflagen wird kein "git delete" ausgeführt, sodass Märchen, die in der nächsten Auflage nicht mehr vorhanden waren dennoch im Repository sind.
Todo:
- Metadaten raus: in den Märchen sind noch einige Metadaten wie URLs und Seitenzahlen die Unterschiede zwischen den Versionen größer erscheinen lassen, als sie sind.
- HTML-Quellcode vereinheitlichen: es gibt doch recht große Unterschiede zwischen den Auflagen, wie z.B. Überschriften formatiert sind. Dadurch kommt es zu mehr unterschieden, als tatsächlich vorhanden sind.
- Verwendung einer leichter lesbaren Markupsprache wie Markdown anstatt von HTML
- git-Tool zur guten Darstellung der Unterschiede zwischen Versionen finden und hier empfehlen.