Skip to content

2015 02 06 Stand und Arbeitsplan

Marco Tullney edited this page Dec 7, 2015 · 1 revision

Zusammenfassung:

Im Sommer 2014 veröffentlichte die UB Bielefeld ihre Zahlungen für Open-Access-Publikationsgebühren im Rahmen des DFG-Programms "Open Access Publizieren". In Zusammenarbeit mit der DINI AG Elektronisches Publizieren beteiligen sich mittlerweile zehn Einrichtungen in Deutschland, die Open-Access-Publikationsgebühren im Umfang von rund 2 Millionen EURO im Sinne des Open Data unter verbindlichen Lizenzbedingungen über GitHub teilen.

Das vorliegende Dokument fasst den Stand der Aktivitäten zusammen. Die Arbeitsplanung für das Jahr 2015, welche als Diskussionsgrundlage für eine gemeinsame virtuelle Konferenz dient, umfasst: 1) Datenmeldung für die Rechnungsperiode 2014, 2) Berichtserfordernisse insbesondere für die DFG-Ausschreibung "Open Access Publizieren", 3) technische Weiterentwicklung, 4) Internationalisierung des Vorhabens und 5) Dissemination der Ergebnisse.

Stand der Aktivitäten

Umfang

Der Datensatz dokumentiert derzeit 1599 Open-Access-Artikel, deren Veröffentlichung zehn Universitäten und außeruniversitäre Forschungseinrichtungen in Deutschland im Umfang von rund 1.938.505 EURO finanziert haben.

Articles Fees paid in EURO Mean Fee paid
MPG 710 885731.68 1247.51
KIT 194 228626.36 1178.49
Regensburg U 163 182609.56 1120.30
Bielefeld U 159 186096.22 1170.42
Duisburg-Essen U 106 120575.00 1137.50
Konstanz U 85 107776.13 1267.95
FZJ - ZB 76 90410.94 1189.62
Leipzig U 60 79602.89 1326.71
Hannover U 42 53305.10 1269.17
TU Clausthal 4 3770.77 942.69

Tabelle 1: Teilnehmende Universitäten und außeruniversitäre Forschungseinrichtungen

Die geförderten Artikel entfallen auf 55 verschiedene Verlage und 299 Zeitschriftentitel.

Articles Fees paid in EURO Mean Fee paid
Springer Science + Business Media 688 851217.25 1237.23
Public Library of Science (PLoS) 385 492265.16 1278.61
Frontiers Media SA 114 142659.31 1251.40
IOP Publishing 78 82758.78 1061.01
Copernicus GmbH 72 86711.64 1204.33
Optical Society of America (OSA) 58 88026.52 1517.70
Hindawi Publishing Corporation 34 24890.82 732.08
MDPI AG 27 26425.74 978.73
Wiley-Blackwell 20 27610.80 1380.54
Oxford University Press (OUP) 12 20033.11 1669.43
other (n=45) 111 95905.52 864.01

Tabelle 2: Publikationsgebühren je Verlag

Articles Fees paid in EURO Mean Fee paid
PLoS ONE 331 385460.94 1164.53
New J. Phys. 78 82758.78 1061.01
BMC Genomics 77 97569.90 1267.14
BMC Bioinformatics 64 78769.42 1230.77
Opt. Express 55 85037.92 1546.14
BMC Evol Biol 45 56682.46 1259.61
Front. Psychology 38 48408.16 1273.90
Atmos. Chem. Phys. Discuss. 30 39135.23 1304.51
BMC Plant Biology 29 38171.94 1316.27
Genome Biol 24 41316.76 1721.53
other (n=289) 828 985193.14 1189.85

Tabelle 3: Publikationsgebühren je Zeitschriftentitel

Abbildung 1 weist die Lage- und Streumaße der bezahlten Publikationsgebühr je beteiligter Einrichtung nach.

Abbildung 1: Publikationsgebühr je Einrichtung

Meldeprozess

Die Meldung der Publikationskosten erfolgt über die Social Coding Plattform GitHub. Textbasierte csv-Tabellen und die GIT-Versionskontrolle stellen sicher, dass jede Ergänzung gespeichert und, bei Bedarf, wiederhergestellt werden kann.

Eine Handreichung beschreibt die einzelnen Schritte. Der Datensatz baut auf bereits etablierte Melderoutinen an den einzelnen Einrichtungen im Rahmen der Publikationsfonds auf. Dies gilt insbesondere für Universitäten, die zusätzliche Förderungen durch die DFG im Rahmen des Programms Open Access Publizieren erhalten.

Auch Einrichtungen, die nicht über einen Publikationsfonds verfügen, oder außeruniversitäre Einrichtungen sind eingeladen, ihre Kosten beizusteuern.

Wenn eine Einrichtungen nicht auf GitHub für die Datenmeldung zurückgreifen möchte, können die Tabellen auch per Email gesendet werden; die UB Bielefeld übernimmt dann die Datenveröffentlichung.

Anreicherung

Damit die verteilten Publikationskosten der Einrichtungen vergleichbar sind, findet eine Normalisierung der Metadaten über automatische API-Abfragen mittels der doi statt.

Quelle Variable Beschreibung
CrossRef Publisher Verlag
CrossRef Journal Zeitschriftentitel
CrossRef ISSN.1 ISSN
CrossRef ISSN.2 alternative ISSN
CrossRef indexed_in_CrossRef Artikel in CrossRef? (logical)
EuropePMC PMID PubMed ID
EuropePMC PMCID PubMed Central ID
Web of Science ut Web of Science ID
DOAJ DOAJ Zeitschrift im DOAJ? (logical)

Rund 98% der gemeldeten Artikel sind auch in CrossRef indexiert. Sollten die Metadaten eines Artikels nicht über CrossRef verfügbar sein, werden die Ansetzungen der meldenden Einrichtung übernommen. Fehlende Informationen sind mit NA gekennzeichnet.

Die Anreicherungen erfolgen skriptbasiert und nutzen Module der Open-Source-Communities rOpenSci und LibreCat nach.

Auswertungen

Die Organisation des Datensatzes folgt der Idee der Tidy Data. Dadurch soll sichergestellt werden, dass Datenanalysen über offenen statistische Umgebungen wie R aus dem Datensatz heraus gelingen.

Der Gesamtdatensatz ist unter https://github.com/njahn82/unibiAPC/blob/master/data/apc_de.csv durchsuchbar.

Erste Auswertungen befinden sich in der README. Die Visualisierungen auf der Projektwebseite sollen öffentlichkeitswirksam die Mittelflüsse abbilden. Sie basieren auf d3.js.

Zitierung und Archivierung

Die GitLab-Plattform der Universitätsbibliothek Bielefeld speichert ein Remote Repository einschließlich der Versionsgeschichte. Das Remote Repository ist bei DataCite unter doi:10.4119/UNIBI/UB.2014.18 registriert.

Lizenz

Die Veröffentlichung der Datensätze erfolgt unter der Open Database License http://opendatacommons.org/licenses/odbl/1.0/ und Inhalte unter der Creative Commons Attribution 4.0 Unported License.

Förderung des Vorhabens

Ende Oktober 2014 hat der Rektor der Universität Bielefeld im Rahmen der DFG-Ausschreibung "Open Access Transformation" einen Antrag auf Förderung gestellt, welcher u.a. die transparente Dokumentation und Nachnutzung von Open-Access-Publikationsgebühren zum Gegenstand hat.

Verwandte Initiativen

Insbesondere JISC und der Wellcome Trust sind international sichtbare Treiber für die transparente Zugänglichmachung von Open-Access-Publikationskosten. Über FigShare sind über 50 Datensätze zumeist britischer Universitäten unter dem Stichwort "article processing charges" offen zugänglich. CottageLabs entwickelt eine Pilotanwendung für JISC Monitor. Eine Definition eines Austauschformats basierend auf RIOXX liegt vor (siehe: https://github.com/JiscMonitor/allapc).

Dissemination

Beiträge über das Vorhaben

Vorträge mit Bezug zum Vorhaben


Ziele und Arbeitsprogramm bis zum 30. Juni 2015

Die Ziele für die Weiterentwicklung des Vorhabens bis zum 30. Juni 2015 sind:

  1. Zugänglichmachung von Publikationsgebühren, die die beteiligten Einrichtungen im Jahr 2014 gefördert haben

Insgesamt haben bereits fünf Einrichtungen begonnen, ihre finanzierten Publikationsgebühren für die Rechnungsperiode 2014 unter einer offenen Lizenz verfügbar zu machen.

2007 2008 2009 2010 2011 2012 2013 2014 2015
MPG 40 70 67 69 69 55 340 0 0
KIT 0 0 0 0 0 95 99 0 0
Regensburg U 0 0 0 0 0 76 87 0 0
Bielefeld U 0 0 0 0 0 38 55 66 0
Duisburg-Essen U 0 0 0 0 0 0 55 51 0
Konstanz U 0 0 0 0 0 35 50 0 0
FZJ - ZB 0 0 0 0 0 0 0 75 1
Leipzig U 0 0 0 0 0 0 0 59 1
Hannover U 0 0 0 0 0 0 16 26 0
TU Clausthal 0 0 0 0 0 0 4 0 0

Tabelle 4: Verteilung gemeldete Gebühren nach Rechnungsperiode

Zu fragen wäre, wann sämtliche Datensätze für 2014 zur Verfügung stünden und ob das bisherige Verfahren der Meldung nutzbar ist. Idealerweise lässt sich ein gemeinsamer Stichtag finden.

  1. Unterstützung der Antragstellung im DFG-Programm "Open Access Publizieren"

Ein harmonisierter und offen zugänglicher Datensatz soll für die Beantwortung des Berichtspunkts, "ob und in welcher Höhe Ihre Hochschule Autorinnen und Autoren bei der Finanzierung von Publikationskosten unterstützt", nachnutzbar sein.

Hier wäre zu fragen, ob die im Gesamtdatensatz enthaltene Variablen für die Beantwortung des Berichtspunkts geeignet sind oder der Datensatz ggf. um weitere Variablen erweitert werden muss. Wie lassen sich wissenschaftspolitische Anforderungen wie die Nutzung von offenen Lizenzen über den Datensatz beantworten? Gibt es bereits Benchmarks, die sich aus dem Datensatz heraus umsetzen lassen?

  1. Konsolidierung und bessere Dokumentation der Datenbereinigung, -anreicherung und -analyseschritte.

Die Entwicklung erfolgt weiterhin skriptbasiert, um die automatisierten Prozesse der Datenkonsolidierung und -anreicherung zu erproben. Jedoch ist es sinnvoll, sich mit verwandten Initiativen abzustimmen, um Mehrarbeit zu vermeiden. So beteiligen wir uns an der Weiterentwicklung des R-Clients für CrossRef rcrossref von rOpenSci

Gäbe es Ihrerseits Vorschläge, wie sich die automatischen Routinen im Sinne einer verbesserten Nachnutzung reformulieren lassen? Auf welche automatischen Analyseverfahren möchten Sie zurückgreifen? Mittels welcher Quellen sollte der Datensatz mit zusätzlichen Informationen angereichert werden?

  1. Internationalisierung der Projektdarstellung und Dokumentationen im Wiki.

Das GitHub Projekt läuft derzeit über einen persönlichen Account. Unter https://github.com/openapc ist eine GitHub Organisation eingerichtet, in die das Repository überführt werden soll.

Im gleichen Schritt wäre es sinnvoll, die Dokumentationen im Wiki ins Englische zu übertragen, um die internationale Sichtbarkeit und Nachnutzung der Daten zu verbessern.

Für die gemeinsame Bearbeitung der Punkte 3 und 4 wäre sicherlich ein Hackathon im Umfang von zwei Tagen hilfreich.

  1. Dissemination

Neben der Webdarstellung soll das Vorhaben auf Fachtagungen vorgestellt werden.

  • Zur ELAG beabsichtigen wir die Einreichung eines Workshops mit dem Arbeitstitel "Hacking APC Data with R" (Deadline 14. Februar).

  • Die LIBER Konferenz böte sich an, um Ergebnisse, die auf dem Datensatz basieren, vorzustellen (Deadline 15. Februar).

  • Bielefeld hat nichts für den Bibliothekartag eingereicht. Jedoch könnten die Ergebnisse als Poster aufbereitet werden. Deadline Call for Poster 28. Februar.

  • Open Access Tage in Zürich. Hier wäre der Vorschlag, einen gemeinsamen Workshop einzureichen, um weitere Einrichtungen zu gewinnen und die weiteren Arbeiten ab 2015 zu diskutieren.

Wer möchte sich beteiligen?

Clone this wiki locally