-
install git-lfs
0.curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
0.sudo apt-get install git-lfs
0.git lfs install
-
clone repo
https://github.com/dertilo/german-legal-data.git
-
pip install -r requirements.txt
-
start elasticsearch with
cd elasticsearch_index && docker-compose up -d
-
populate es-index:
python bverfg_to_es.py
populating es-index with 16197 documents took: 10.25 seconds
- following numbers are calculated on
Entscheidungen des Bundesverfassungsgerichts
, see BverfG.jsonl.gz - count fields:
python count_fields.py
field count
8 aktenzeichen 16197
9 date 16197
10 entscheidungsdatum 16197
11 subtitle 16197
12 title 16197
13 url 16197
14 zitiervorschlag 16197
4 Orientierungssatz 14274
2 Gründe 12965
7 Tenor 7155
3 Leitsatz 2770
5 Sonstiger Orientierungssatz 475
0 Abweichende Meinung 179
1 Entscheidungsgründe 2
6 Tatbestand 2
- before 1990
GET /bverfg/_count
{
"query": {
"range": {
"date": {
"lte": "1990-01-01"
}
}
}
}
-> "count" : 4592
GET /bverfg/_search
{
"query": {
"match_phrase": {
"Gründe": "Verfassungswidrigkeit"
}
},
"_source": {"includes": "Gründe"},
"size": 20
}
-> 2161
decisions
- get index-size:
sudo du -sh /var/lib/docker/volumes/elasticsearch_index_esdata1/_data
- not sure whether these wordclouds make any sense