Videomuseum est un réseau de musées et d’organismes gérant des collections d’art moderne et contemporain (musées nationaux, régionaux, départementaux ou municipaux, Cnap (collection du Fnac), Frac, fondations) qui se sont regroupés pour développer, en commun, des méthodes et des outils utilisant les nouvelles technologies de traitement de l’information afin de mieux recenser et diffuser la connaissance de leur patrimoine muséographique.
Les méthodes et outils utilisés dans ce réseau permettent : l’informatisation de la documentation et de la gestion des collections par le logiciel Gcoll et la diffusion de la connaissance de ces mêmes collections par Internet avec le logiciel Navigart.
Ce projet, d'initiative publique, ne permet pas (encore ?) la mise en place d'une API publique offrant à chacun, alors que les collections nationales françaises sont publiques, d'explorer à sa guise le patrimoine de la Nation. Dans le cadre d'un projet personnel, il m'a fallu récupérer quelques données du Centre Pompidou, d'où l'existence de ce petit script en python.
pip install argparse json re requests time
To scrape Navigart, run:
python navigart-scraper.py --museum cnam --start 0 --limit 1000
The --museum
parameter actually supports the databases of those french museum:
cnam
: Centre national d'art moderne (Centre Georges Pompidou).cnap
: Centre national des arts plastiques.mamvp
: Musée d'art moderne de la ville de Paris.mnpp
: Musée national Pablo Picasso.
By default, this script produces a JSON file by the given limit parameter. It helps to not having a too big final file but some smaller files. A JSON merger script is provided.
python json-merger.py --folder ./data/cnam
This script removes each artwork for which the field specified as parameter is empty or null. In the example below, only the artworks whose object_date is not empty or null will be kept in the output file.
To scrape Navigart, run:
python navigart-cleaner.py --filename data/cnam/cnam --field object_date
This script keeps each artwork for which the field specified matches the parameter (case sensitive). In the example below, only the artworks whose type is "Peinture" will be kept in the output file.
To scrape Navigart, run:
python navigart-filterer.py --filename data/cnam/cnam --field object_type -s Peinture
This script sorts the input file with the field specified as parameter. In the example below, the artwork will be sorted by date in ASC order.
To scrape Navigart, run:
python navigart-sorter.py --filename data/cnam/cnam --field object_date_clean