Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/cvubrugier/edwypub
Convert articles from Mediapart, a French online newspaper, to EPUB e-books.
https://github.com/cvubrugier/edwypub
converter epub newspaper python
Last synced: 19 days ago
JSON representation
Convert articles from Mediapart, a French online newspaper, to EPUB e-books.
- Host: GitHub
- URL: https://github.com/cvubrugier/edwypub
- Owner: cvubrugier
- License: mit
- Created: 2024-02-24T11:04:56.000Z (10 months ago)
- Default Branch: main
- Last Pushed: 2024-03-30T17:03:08.000Z (9 months ago)
- Last Synced: 2024-03-31T17:46:11.600Z (9 months ago)
- Topics: converter, epub, newspaper, python
- Language: Python
- Homepage:
- Size: 80.1 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# edwypub - convertir un article de Mediapart au format EPUB
edwypub permet de convertir un article du site d'actualité
[Mediapart](https://www.mediapart.fr)
en un livre électronique au format
[EPUB](https://www.w3.org/TR/epub-overview-33/).Bonne lecture !
## Installation
edwypub est écrit en Python et dépend des modules externes suivants :
* [beautifulsoup4](https://pypi.org/project/beautifulsoup4/)
* [ebooklib](https://pypi.org/project/EbookLib/)
* [requests](https://pypi.org/project/requests/)Le programme peut s'installer dans un
[environnement virtuel](https://docs.python.org/3.12/library/venv.html)
comme suit:$ python3 -m venv /path/to/venv
$ source /path/to/venv/bin/activate
$ git clone https://github.com/cvubrugier/edwypub.git
$ cd edwypub
$ pip install .## Utilisation
### Conversion d'un article sauvegardé au format HTML
Les articles sauvegardés au format HTML à convertir au format EPUB
doivent doivent être fournis comme arguments :$ edwypub un-article-a-convertir.html
### Téléchargement et conversion d'un article à partir de son URL
Pour télécharger des articles réservés aux abonnés depuis le site de
Mediapart, le programme a besoin de connaître la valeur du cookie
`MPSESSID`. Cette valeur peut être obtenue en se connectant au site de
Mediapart avec un navigateur Web puis en activant les outils de
développement (raccourcis `Ctrl+Maj+i` ou `F12`).Il faut sélectionner l'onglet _Stockage_ puis l'élément _Cookies_.
![Récupération du cookie MPSESSID dans Mozilla Firefox](./session-id-capture.png)
La valeur du cookie `MPSESSID` est transmise au programme via
l'argument `--session`. Suivent les URLs des articles à télécharger et
à convertir au format EPUB.$ edwypub --session $MPSESSID https://www.mediapart.fr/rubrique/un-article-a-convertir
## Licence
edwypub est publié sous licence [MIT](https://spdx.org/licenses/MIT.html).