Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/cvubrugier/edwypub

Convert articles from Mediapart, a French online newspaper, to EPUB e-books.
https://github.com/cvubrugier/edwypub

converter epub newspaper python

Last synced: 19 days ago
JSON representation

Convert articles from Mediapart, a French online newspaper, to EPUB e-books.

Awesome Lists containing this project

README

        

# edwypub - convertir un article de Mediapart au format EPUB

edwypub permet de convertir un article du site d'actualité
[Mediapart](https://www.mediapart.fr)
en un livre électronique au format
[EPUB](https://www.w3.org/TR/epub-overview-33/).

Bonne lecture !

## Installation

edwypub est écrit en Python et dépend des modules externes suivants :

* [beautifulsoup4](https://pypi.org/project/beautifulsoup4/)
* [ebooklib](https://pypi.org/project/EbookLib/)
* [requests](https://pypi.org/project/requests/)

Le programme peut s'installer dans un
[environnement virtuel](https://docs.python.org/3.12/library/venv.html)
comme suit:

$ python3 -m venv /path/to/venv
$ source /path/to/venv/bin/activate
$ git clone https://github.com/cvubrugier/edwypub.git
$ cd edwypub
$ pip install .

## Utilisation

### Conversion d'un article sauvegardé au format HTML

Les articles sauvegardés au format HTML à convertir au format EPUB
doivent doivent être fournis comme arguments :

$ edwypub un-article-a-convertir.html

### Téléchargement et conversion d'un article à partir de son URL

Pour télécharger des articles réservés aux abonnés depuis le site de
Mediapart, le programme a besoin de connaître la valeur du cookie
`MPSESSID`. Cette valeur peut être obtenue en se connectant au site de
Mediapart avec un navigateur Web puis en activant les outils de
développement (raccourcis `Ctrl+Maj+i` ou `F12`).

Il faut sélectionner l'onglet _Stockage_ puis l'élément _Cookies_.

![Récupération du cookie MPSESSID dans Mozilla Firefox](./session-id-capture.png)

La valeur du cookie `MPSESSID` est transmise au programme via
l'argument `--session`. Suivent les URLs des articles à télécharger et
à convertir au format EPUB.

$ edwypub --session $MPSESSID https://www.mediapart.fr/rubrique/un-article-a-convertir

## Licence

edwypub est publié sous licence [MIT](https://spdx.org/licenses/MIT.html).