https://github.com/hal91190/rdfsearch
Exemple de projet de recherche par mots-clés dans des données RDF
https://github.com/hal91190/rdfsearch
jena keyword-search lucene rdf teaching
Last synced: 6 months ago
JSON representation
Exemple de projet de recherche par mots-clés dans des données RDF
- Host: GitHub
- URL: https://github.com/hal91190/rdfsearch
- Owner: hal91190
- Created: 2015-02-28T13:11:56.000Z (over 10 years ago)
- Default Branch: master
- Last Pushed: 2025-01-27T10:29:22.000Z (8 months ago)
- Last Synced: 2025-04-11T18:21:49.219Z (6 months ago)
- Topics: jena, keyword-search, lucene, rdf, teaching
- Language: Java
- Size: 216 KB
- Stars: 1
- Watchers: 0
- Forks: 15
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# rdfsearch
Exemple de projet de recherche par mots-clés dans des données RDF## Jeu de données RDF
Le jeu de données est disponible dans l'espace ecampus de l'UE.## Utilisation du projet exemple
### Compilation
```
$ ./gradlew build
```### Indexation du jeu de données RDF
```
$ ./gradlew run --args="-i BNBLODB_sample.nt"
```### Recherche dans les données RDF
```
$ ./gradlew run --args="BNBLODB_sample.nt '-social +life'"
```## Questions
### Exploration du jeu de données
* Quelles données sont décrites dans ce fichier RDF ?
* Quels vocabulaires RDF sont utilisés dans ce document ? Que représentent-ils ?
* De quel type sont les livres ?
* Quelle propriété représente les auteurs d'un livre ?### Gestion de données RDF avec Jena
* Quelle interface de la bibliothèque Jena représente un jeu de données RDF (ensemble de triplets) ?
* Quelles étapes permettent de créer et de charger un jeu de données RDF à partir d'un fichier ?
* Quelles méthodes permettent de naviguer dans un jeu de données RDF ?
* Comment utiliser le langage SPARQL avec la bibliothèque Jena ?
Chercher la chaîne "TODO(SPARQL)" dans le projet.### Indexation avec Lucene
* Expliquer le code de construction d'un index Lucene ("TODO(index)")
* En particulier, quel est le rôle de l'analyseur ?
* Quels rôles jouent le document et les différents types de champs (StringField, TextField, ...) ?
* Ajouter l'indexation de l'isbn et des auteurs ("TODO(new fields)")### Rechercher dans l'index Lucene
* Expliquer le code de recherche dans un index Lucene ("TODO(search)")
* En particulier, quels rôles jouent les classes QueryParser, Query, TopDocs et ScoreDoc ?
* Générer une page HTML présentant les résultats de la recherche (titre du document, score et lien la page de la *British Library*)## Références
### Gestion de données RDF avec Jena
* [Site officiel](http://jena.apache.org/) du projet Apache Jena
* [Tutoriels Jena](http://jena.apache.org/tutorials/index.html)
* [Introduction au RDF et à l'API RDF de Jena](https://web-semantique.developpez.com/tutoriels/jena/introduction-rdf/)
* [ARQ - API Application](https://web-semantique.developpez.com/tutoriels/jena/arq/api-application/)
* [Comment utiliser les entrées/sorties RDF de Jena](https://web-semantique.developpez.com/tutoriels/jena/io/)
* [Le tutoriel SPARQL](https://web-semantique.developpez.com/tutoriels/jena/arq/introduction-sparql/)
* [Référence de l'API](http://jena.apache.org/documentation/javadoc/jena/)
* [Introduction to Jena](http://www.ibm.com/developerworks/library/j-jena/), IBM developerWorks### Recherche d'information avec Lucene
* [Site officiel](http://lucene.apache.org/core/)
* [Documentation](http://lucene.apache.org/core/5_0_0/index.html)
* [Module de démonstration](http://lucene.apache.org/core/5_0_0/demo/overview-summary.html#overview_description)