https://github.com/macbre/wbc
Publications from Wielkopolska Biblioteka Cyfrowa converted from DJVU to text format
https://github.com/macbre/wbc
archive djvu poznan python wbc
Last synced: 10 months ago
JSON representation
Publications from Wielkopolska Biblioteka Cyfrowa converted from DJVU to text format
- Host: GitHub
- URL: https://github.com/macbre/wbc
- Owner: macbre
- License: bsd-3-clause
- Created: 2014-08-16T15:06:54.000Z (almost 12 years ago)
- Default Branch: master
- Last Pushed: 2025-07-03T15:31:36.000Z (12 months ago)
- Last Synced: 2025-07-04T18:51:37.201Z (12 months ago)
- Topics: archive, djvu, poznan, python, wbc
- Language: HTML
- Homepage: http://www.wbc.poznan.pl/dlibra
- Size: 383 KB
- Stars: 0
- Watchers: 2
- Forks: 0
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
wbc
===
[](https://github.com/macbre/wbc/actions/workflows/test.yml)
Skrypt importujący publikacje na licencji **Fair Use** w formacie DJVU
z zasobów [Wielkopolskiej Biblioteki Cyfrowej](http://www.wbc.poznan.pl/dlibra)
## Wymagania
* Python 3.6+
* curl + ungzip
* ``djvutxt`` z pakietu ``djvulibre-bin``
```
sudo apt-get install djvulibre-bin python3-lxml
virtualenv --system-site-packages env3 -p python3
source env3/bin/activate
pip install -U -e .
```
## Pobieranie
```
fetch [--no-fetch]
```
## Struktura katalogów
```
- publications/
- /
- index.json
- issues/
-
- .txt
```
## xmlpipe2
Aby wygenerować plik dla [źródła SphinxSE `xmlpipe2`](http://sphinxsearch.com/docs/current/xmlpipe2.html):
```
generate_xml 106644 | gzip -c > 106644.xml.gz
generate_xml 106644,142333 | gzip -c > kronika_gazeta_wielkiego_ksiestwa.xml.gz
```
## Publikacje
* [Kronika Miasta Poznania](http://www.wbc.poznan.pl/dlibra/publication?id=106644)
* [Dziennik Poznański](http://www.wbc.poznan.pl/dlibra/publication?id=2290)
* [Fetch the Sphinx XML](http://s3.macbre.net/wbc/kronika_gazeta_wielkiego_ksiestwa.xml.gz)