Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/albertoolla/aranzulla-dataset

Creare il tuo Aranzulla personale partendo dai suoi articoli!
https://github.com/albertoolla/aranzulla-dataset

Last synced: 9 days ago
JSON representation

Creare il tuo Aranzulla personale partendo dai suoi articoli!

Awesome Lists containing this project

README

        

# aranzulla-dataset

### Avviso importante

Dopo la pubblicazione dello SPIEGONE ho ricevuto vari messaggi privati e questo mi fa un enorme piacere, uno di queste era proprio di **Salvatore Aranzulla**!

Ho subito pensato:
> "Non ci credo.
>
> Salvatore Aranzulla, in persona, manda un messaggio proprio a me?
>
> Fantastico!
>
> Deve aver apprezzato l'esperimento sulle reti neurali addestrate sui suoi articoli." :)

Invece no...
Salvatore non ha affatto apprezzato, e mi ha gentilmente chiesto (previa azione legale) di eliminare il dataset d'addestramento che avevo condiviso gratuitamente su GitHub.

Ho quindi provveduto ad **eliminare il dataset**.
Non voglio beccarmi denunce legali, il mio era solo un esperimento per invogliare le persone ad approfondire l'argomento del machine learning.

## Come ottenere il "dataset fuorilegge"?

Se volete riprovare l'esperimento fatelo, non demoralizzatevi! Scegliete qualcuno che se lo meriti. Ecco qualche esempio:
- RNN basata su Shakespeare https://github.com/martin-gorner/tensorflow-rnn-shakespeare
- RNN basata su Obama https://github.com/samim23/obama-rnn
- RNN basata su Ernest Hemingway https://github.com/cvalenzuela/Selected_Stories

Se dovesse venirvi l'insana idea di creare dei "dataset fuorilegge", potete usare una qualsiasi di queste librerie:
- PHP: Simple HTML DOM Parser http://simplehtmldom.sourceforge.net/manual.htm
- Node.js: NodeCrawler http://nodecrawler.org/
- Python: Scrapy https://scrapy.org/
- Ruby: Nokogiri http://www.nokogiri.org/
- Java: Crawler4j https://github.com/yasserg/crawler4j
- C#: Abot https://github.com/sjdirect/abot

Buona programmazione e buon machine learning... anche a te Salvatore!