An open API service indexing awesome lists of open source software.

https://github.com/n3d1117/sisop17

Esercizio per esame di Sistemi Operativi - 2017
https://github.com/n3d1117/sisop17

crawler html java parser semaphores synchronization thread-safety threading

Last synced: 7 months ago
JSON representation

Esercizio per esame di Sistemi Operativi - 2017

Awesome Lists containing this project

README

          

# Testo dell'esercizio

Si vuole simulare un sistema di web crawling, nel quale sono presenti N thread Crawler, dove ognuno preleva una URL da un oggetto UrlStore che contiene le Url che devono essere analizzate (attende se vuoto), effettua il download della pagina HTML (si simuli questa attività con una attesa), la salva in un oggetto DocStore, incrementa una variabile globale che indica il numero di download effettuati da tutti gli N Crawler e quindi preleva una nuova URL e procede.

Sono presenti anche M thread Parser dove ognuno preleva dal DocStore una pagina HTML (attende se vuoto), effettua il parsing della pagina HTML (si simuli questa attività con una attesa), produce l’insieme dei link che sono presenti nella pagina aggiungendoli nell’oggetto UrlStore ed infine incrementa variabile globale che indica il numero di pagine analizzate dagli M Parser.

Ai fini della simulazione si ipotizza che da ogni pagina HTML vengano estratte un numero casuale di nuove URL comprese tra 0 e 10.

Per rappresentare le URL e le pagine HTML si usino oggetti String e per memorizzare le Url e pagine HTML si usi la classe ArrayList (che NON è thread-safe) che ha metodo add per inserire in coda e metodo remove(0) per estrarre dalla testa.

Il programma principale deve inserire nel UrlStore una URL iniziale, avviare i thread e terminare l’esecuzione dei thread dopo 60 secondi e ogni secondo scriva quanti download e parsing sono stati fatti.

Implementare il sistema descritto in Java usando i semafori per la sincronizzazione tra thread.

[Link all'esame originale del 7/6/17](http://www.disit.org/bellini-sisop/compiti/compito-07-06-2017.pdf)