https://github.com/cbyad/darml
https://github.com/cbyad/darml
Last synced: 3 months ago
JSON representation
- Host: GitHub
- URL: https://github.com/cbyad/darml
- Owner: cbyad
- Created: 2018-04-09T16:56:00.000Z (about 7 years ago)
- Default Branch: master
- Last Pushed: 2018-04-15T12:31:52.000Z (about 7 years ago)
- Last Synced: 2025-01-19T13:49:44.447Z (5 months ago)
- Language: Scala
- Size: 69.3 KB
- Stars: 0
- Watchers: 3
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Brooklyn House pricing
__[Téléchargement du data set](https://www.kaggle.com/tianhwu/brooklynhomes2003to2017/data)__Pour generer le .jar :
* Se mettre à la racine du projet et exécuter la commande :mvn clean package
et le jar generé sera dans le dossier __target__Pour lancer l'application :
* Se mettre à la racine du __.jar__ __[BrooklynHousePricing.jar]__
* l'exécuter en effectuant la commande suivante :
spark-submit --class com.upmc.dar.App --master local BrooklynHousePricing.jar input nbr
avec* **input :** le chemin absolue du fichier csv à analyser
* **nbr :** le pourcentage du contenu à analyser (valeur comprise entre [1,100])## Exemple pour évaluer 40% du dataset
spark-submit --class com.upmc.dar.App --master local BrooklynHousePricing.jar
/BrooklynHousePricing/files/brooklyn_sales_map.csv 40