Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/albertoolla/aranzulla-dataset
Creare il tuo Aranzulla personale partendo dai suoi articoli!
https://github.com/albertoolla/aranzulla-dataset
Last synced: 9 days ago
JSON representation
Creare il tuo Aranzulla personale partendo dai suoi articoli!
- Host: GitHub
- URL: https://github.com/albertoolla/aranzulla-dataset
- Owner: AlbertoOlla
- Created: 2017-12-01T11:53:26.000Z (about 7 years ago)
- Default Branch: master
- Last Pushed: 2017-12-01T17:18:34.000Z (about 7 years ago)
- Last Synced: 2024-11-07T15:09:21.440Z (2 months ago)
- Homepage: https://www.imparareaprogrammare.it
- Size: 1000 Bytes
- Stars: 2
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# aranzulla-dataset
### Avviso importante
Dopo la pubblicazione dello SPIEGONE ho ricevuto vari messaggi privati e questo mi fa un enorme piacere, uno di queste era proprio di **Salvatore Aranzulla**!
Ho subito pensato:
> "Non ci credo.
>
> Salvatore Aranzulla, in persona, manda un messaggio proprio a me?
>
> Fantastico!
>
> Deve aver apprezzato l'esperimento sulle reti neurali addestrate sui suoi articoli." :)Invece no...
Salvatore non ha affatto apprezzato, e mi ha gentilmente chiesto (previa azione legale) di eliminare il dataset d'addestramento che avevo condiviso gratuitamente su GitHub.Ho quindi provveduto ad **eliminare il dataset**.
Non voglio beccarmi denunce legali, il mio era solo un esperimento per invogliare le persone ad approfondire l'argomento del machine learning.## Come ottenere il "dataset fuorilegge"?
Se volete riprovare l'esperimento fatelo, non demoralizzatevi! Scegliete qualcuno che se lo meriti. Ecco qualche esempio:
- RNN basata su Shakespeare https://github.com/martin-gorner/tensorflow-rnn-shakespeare
- RNN basata su Obama https://github.com/samim23/obama-rnn
- RNN basata su Ernest Hemingway https://github.com/cvalenzuela/Selected_StoriesSe dovesse venirvi l'insana idea di creare dei "dataset fuorilegge", potete usare una qualsiasi di queste librerie:
- PHP: Simple HTML DOM Parser http://simplehtmldom.sourceforge.net/manual.htm
- Node.js: NodeCrawler http://nodecrawler.org/
- Python: Scrapy https://scrapy.org/
- Ruby: Nokogiri http://www.nokogiri.org/
- Java: Crawler4j https://github.com/yasserg/crawler4j
- C#: Abot https://github.com/sjdirect/abotBuona programmazione e buon machine learning... anche a te Salvatore!