{"id":16107631,"url":"https://github.com/n3d1117/sisop17","last_synced_at":"2025-04-06T03:45:38.740Z","repository":{"id":107065636,"uuid":"99440900","full_name":"n3d1117/SisOp17","owner":"n3d1117","description":"Esercizio per esame di Sistemi Operativi - 2017","archived":false,"fork":false,"pushed_at":"2017-08-07T08:48:34.000Z","size":11,"stargazers_count":0,"open_issues_count":0,"forks_count":0,"subscribers_count":2,"default_branch":"master","last_synced_at":"2025-02-12T10:18:15.833Z","etag":null,"topics":["crawler","html","java","parser","semaphores","synchronization","thread-safety","threading"],"latest_commit_sha":null,"homepage":"","language":"Java","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/n3d1117.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2017-08-05T18:29:08.000Z","updated_at":"2017-08-13T08:54:40.000Z","dependencies_parsed_at":"2023-07-21T04:31:09.487Z","dependency_job_id":null,"html_url":"https://github.com/n3d1117/SisOp17","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/n3d1117%2FSisOp17","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/n3d1117%2FSisOp17/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/n3d1117%2FSisOp17/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/n3d1117%2FSisOp17/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/n3d1117","download_url":"https://codeload.github.com/n3d1117/SisOp17/tar.gz/refs/heads/master","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":247430835,"owners_count":20937873,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["crawler","html","java","parser","semaphores","synchronization","thread-safety","threading"],"created_at":"2024-10-09T19:23:58.141Z","updated_at":"2025-04-06T03:45:38.723Z","avatar_url":"https://github.com/n3d1117.png","language":"Java","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Testo dell'esercizio\n\nSi vuole simulare un sistema di web crawling, nel quale sono presenti N thread Crawler, dove ognuno preleva una URL da un oggetto UrlStore che contiene le Url che devono essere analizzate (attende se vuoto), effettua il download della pagina HTML (si simuli questa attività con una attesa), la salva in un oggetto DocStore, incrementa una variabile globale che indica il numero di download effettuati da tutti gli N Crawler e quindi preleva una nuova URL e procede. \n\nSono presenti anche M thread Parser dove ognuno preleva dal DocStore una pagina HTML (attende se vuoto), effettua il parsing della pagina HTML (si simuli questa attività con una attesa), produce l’insieme dei link che sono presenti nella pagina aggiungendoli nell’oggetto UrlStore ed infine incrementa variabile globale che indica il numero di pagine analizzate dagli M Parser. \n\nAi fini della simulazione si ipotizza che da ogni pagina HTML vengano estratte un numero casuale di nuove URL comprese tra 0 e 10. \n\nPer rappresentare le URL e le pagine HTML si usino oggetti String e per memorizzare le Url e pagine HTML si usi la classe ArrayList (che NON è thread-safe) che ha metodo add per inserire in coda e metodo remove(0) per estrarre dalla testa.\n\nIl programma principale deve inserire nel UrlStore una URL iniziale, avviare i thread e terminare l’esecuzione dei thread dopo 60 secondi e ogni secondo scriva quanti download e parsing sono stati fatti.\n\nImplementare il sistema descritto in Java usando i semafori per la sincronizzazione tra thread.\n\n[Link all'esame originale del 7/6/17](http://www.disit.org/bellini-sisop/compiti/compito-07-06-2017.pdf)\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fn3d1117%2Fsisop17","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fn3d1117%2Fsisop17","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fn3d1117%2Fsisop17/lists"}