Skip to content

Latest commit

 

History

History
66 lines (50 loc) · 3.04 KB

README.md

File metadata and controls

66 lines (50 loc) · 3.04 KB

Navigart Pytools

Videomuseum est un réseau de musées et d’organismes gérant des collections d’art moderne et contemporain (musées nationaux, régionaux, départementaux ou municipaux, Cnap (collection du Fnac), Frac, fondations) qui se sont regroupés pour développer, en commun, des méthodes et des outils utilisant les nouvelles technologies de traitement de l’information afin de mieux recenser et diffuser la connaissance de leur patrimoine muséographique.

Les méthodes et outils utilisés dans ce réseau permettent : l’informatisation de la documentation et de la gestion des collections par le logiciel Gcoll et la diffusion de la connaissance de ces mêmes collections par Internet avec le logiciel Navigart.

Ce projet, d'initiative publique, ne permet pas (encore ?) la mise en place d'une API publique offrant à chacun, alors que les collections nationales françaises sont publiques, d'explorer à sa guise le patrimoine de la Nation. Dans le cadre d'un projet personnel, il m'a fallu récupérer quelques données du Centre Pompidou, d'où l'existence de ce petit script en python.

Installation globale

pip install argparse json re requests time

Navigart Scraper

Usage

To scrape Navigart, run:

python navigart-scraper.py --museum cnam --start 0 --limit 1000

Supported french museum databases

The --museum parameter actually supports the databases of those french museum:

JSON Merger

By default, this script produces a JSON file by the given limit parameter. It helps to not having a too big final file but some smaller files. A JSON merger script is provided.

Usage

python json-merger.py --folder ./data/cnam

Navigart Cleaner

This script removes each artwork for which the field specified as parameter is empty or null. In the example below, only the artworks whose object_date is not empty or null will be kept in the output file.

Usage

To scrape Navigart, run:

python navigart-cleaner.py --filename data/cnam/cnam --field object_date

Navigart Filterer

This script keeps each artwork for which the field specified matches the parameter (case sensitive). In the example below, only the artworks whose type is "Peinture" will be kept in the output file.

Usage

To scrape Navigart, run:

python navigart-filterer.py --filename data/cnam/cnam --field object_type -s Peinture

Navigart Sorter

This script sorts the input file with the field specified as parameter. In the example below, the artwork will be sorted by date in ASC order.

Usage

To scrape Navigart, run:

python navigart-sorter.py --filename data/cnam/cnam --field object_date_clean