Für verlässliche Wissenschaft sind reproduzierbare Veröffentlichungen essenziell - aber oft sind sie nicht gegeben12. Dieser 5-Minuten-Vortrag motiviert, wieso Reproduzierbarkeit so wichtig ist, und zeigt eine Lösung zum wirklich reproduzierbaren Veröffentlichen - die er auch selbst nutzt. Ich habe ihn in einem Seminar zum wissenschaftlichen Präsentieren gehalten.
Einen praktischen Leitfaden für entsprechende Veröffentlichungen, den ich auch selbst genutzt habe, liefert das Tutorial: Writing scientific papers for ACP using emacs org-mode [1].
PDF-version [2] (for printing)
Release [3] (to download)
orgmode-version [4] (for editing)
repository [5] (for forking)
„Niemals! Das verbietet die wissenschaftliche Integrität!“
[Quarks & Co., 2013-06-04]
Vertrauen in andere durch saubere Veröffentlichungen.
Vertrauen in die eigene Veröffentlichung.
#+BEGIN_SRC python import pylab data = pylab.genfromtxt( "data.txt") pylab.plot(data) pylab.savefig( "image.png") print "#+caption: desc" print "[[./image.png]]" #+END_src
autoreconf -i && \ ./configure && \ make distcheck
→ repro-pub-0.1.tar.gz (repro-pub-0.5.0.tar.gz [3])
Versuchsaufbau exakt beschreiben.
Bitte stellen Sie Ihre Fragen
arne.babenhauserheide@kit.edu oder arne_bab@web.de
dnl run `autoreconf -i` to generate a configure script. dnl Then run ./configure to generate a Makefile. dnl Finally run make to generate the project. AC_INIT([Repro Pub], [0.5.0], [arne.babenhauserheide@kit.edu]) # Check for programs I need for my build AC_CANONICAL_TARGET AC_ARG_VAR([emacs], [How to call Emacs.]) AC_CHECK_TARGET_TOOL([emacs], [emacs], [no]) AS_IF([test "x$emacs" = "xno"], [AC_MSG_ERROR([cannot find Emacs.])]) # Run automake AM_INIT_AUTOMAKE([foreign]) AM_MAINTAINER_MODE([enable]) AC_CONFIG_FILES([Makefile]) AC_OUTPUT
# basic definitions vortrag = vortrag.pdf vortrag_DATA = vortrag.org data.txt dist-tarball.png vortragdir = . # dist_pkgdata_DATA = rohdaten EXTRA_DIST = ${vortrag_DATA} ${vortrag} # kill editor backups and latex stuff MOSTLYCLEANFILES = \\\#* *~ *.bak *.vrb *.bbl \ *.blg *_flymake.* CLEANFILES = ${vortrag} DISTCLEANFILES = ${CLEANFILES} \\\#* *~ *.bak *.vrb *.bbl \ *.blg *_flymake.* auto/*el all : ${vortrag}
# emacs org-mode beamer build instructions ${vortrag} : ${vortrag_DATA} if test "$<" != "$(notdir $<)"; then \ cp -u "$<" "$(notdir $<)"; fi echo yes | @emacs@ --batch --load "~/.emacs" \ --visit "$(notdir $<)" \ --funcall org-beamer-export-to-pdf if test "$<" != "$(notdir $<)"; \ then rm -f "$(notdir $<)"; \ rm -f $(basename $(notdir $<)).tex \ $(basename $(notdir $<)).tex~ \ auto/$(basename $(notdir $<)).el; \ else rm -f $(basename $<).tex \ $(basename $<).tex~ \ auto/$(basename $<).el; \ fi
Gerade haben Biologen gezeigt3, dass die Verfügbarkeit der Rohdaten von alten Veröffentlichungen jedes Jahr um 17% fällt. Das heißt, schon nach 4 Jahren gibt es für die Hälfte der Veröffentlichungen keine Daten mehr. Die hier gezeigte Methode macht es sehr einfach sicherzustellen, dass alle für die Veröffentlichung notwendigen Daten mitveröffentlicht werden - und erzeugt automatisch eine Archivdatei dafür. ↩
Leider ist die durch die politisch gesetzten Rahmenbedingungen erzwungene Konkurrenzsituation für reproduzierbare Veröffentlichungen hinderlich, denn wer seine Daten und Skripte veröffentlicht - eigentlich alle Programme, die er oder sie nutzte - verspielt die Möglichkeit, sich ein Monopol auf die Daten aufzubauen, das die nächsten Veröffentlichungen sichern könnte. Sobald die Daten draußen sind, können andere damit arbeiten - und nur die schnellsten können veröffentlichen (ja, das System ist dumm…). Zusätzlich stehen sauberer Veröffentlichung oft „IP“-Regeln entgegen - also der Wunsch der Uni, ihre Ergebnisse zu monopolisieren. Zum Glück gibt es mit Open Access inzwischen eine Bewegung gegen solche schädlichen Regelungen - aber der Kampf wird wohl noch lange andauern. Immerhin stehen hier Misstrauen, Gier und leider berechtigte Sorgen um die eigene Zukunft gegen wissenschaftliche Integrität. ↩
The Availability of Research Data Declines Rapidly with Article Age [11] - Zeitungsartikel dazu: The Vast Majority of Raw Data From Old Scientific Studies May Now Be Missing [12]. ↩
Anhang | Größe |
---|---|
repro-pub-0.5.0.pdf [2] | 229.72 KB |
repro-pub-0.5.0.org [4] | 7.4 KB |
repro-pub-thumb-0.5.0.png [13] | 16.88 KB |
repro-pub-0.5.0.tar_.gz [3] | 354.19 KB |
dist-tarball.png [14] | 47.6 KB |
Links:
[1] https://www.draketo.de/english/emacs/writing-papers-in-org-mode-acpd
[2] https://www.draketo.de/files/repro-pub-0.5.0.pdf
[3] https://www.draketo.de/files/repro-pub-0.5.0.tar_.gz
[4] https://www.draketo.de/files/repro-pub-0.5.0.org
[5] https://www.draketo.de/proj/repro-pub
[6] http://gnu.org/s/emacs
[7] http://orgmode.org
[8] http://gnu.org/software/autoconf/
[9] http://gnu.org/software/automake/
[10] http://draketo.de/light/english/free-software/makefile-to-autotools
[11] http://www.cell.com/current-biology/retrieve/pii/S0960982213014000
[12] http://blogs.smithsonianmag.com/science/2013/12/the-vast-majority-of-raw-data-from-old-scientific-studies-may-now-be-missing/
[13] https://www.draketo.de/files/repro-pub-thumb-0.5.0.png
[14] https://www.draketo.de/files/dist-tarball.png