eBook-Produktion mit Open Source Tools – ein Werkstattbericht

eBook-Produktion mit Open Source-ToolsMit dem Siegeszug der eBooks wird eine wichtige Wertschöpfung der Verlage oft obsolet: die Produktion. Hier folgt ein proof of concept. Mit smart publishing – Die neue Wertschöpfung der Verlage haben wir diese Woche unser erstes EPUB erstellt und veröffentlicht, ausschließlich unter Verwendung von Open Source Tools. Und ebenso wie die Publikation im inhaltlichen und formalen Sinne ein Experiment für uns war, war auch die Produktion ein Testlauf dafür, wie eine eBook-Produktion auf dem Stand der Werkzeuge des Jahres 2012  gelingen kann, die ohne jedes Budget außer einigen Stunden Arbeitszeit realisiert wurde. Da der Weg und die Resultate unsere kühnsten Erwartungen übertroffen haben, möchten wir den Launch von smart publishing zum Anlass nehmen, unsere Produktionserfahrungen in Form eines kleinen Werkstattberichts aus dem Leben eines eBook-Produktes zu veröffentlichen.

WordPress/PressBooks

Die Idee zur Zusammenstellung entstand beim Test von PressBooks für den smart-digits-Artikel zu Vook/PressBooks, da das hier verwendeter Modell mir so reizvoll erschien, dass ich es einmal live probieren wollte. Bereits beim Einstieg in den smart digits-Blog war ich, als zuletzt von etwa 10 Jahren in Autorenrolle mit Web-CMS-Systemen konfrontierter und leidgeprüfter Zeitzeuge der Web-Jungsteinzeit, ebenso überrascht wie erfreut darüber, wie schnell, einfach und intuitiv das Arbeiten mit einem Werkzeug wie WordPress gegenüber früheren Jahren geworden ist. Ohne jede Einarbeitung direkt einsteigen, und sich ohne Probleme zurechtfinden, zum “einfach nur schreiben”? Vorher noch nie erlebt… Kein Wunder, dass sich WordPress zum Schweizer Taschenmesser der Blogosphäre entwickelt hat, zumal die Masse der Plugins für nahezu jeden Verwendungszweck schier unüberschaubar ist.

Erwartet man bei PressBooks als EPUB-Konverter für WordPress zunächst eine komplexere Technik-Schicht, traut man nach dem Eintrudeln des PressBook-Accounts seinen Augen nicht: Sieht fast genauso aus wie WordPress, nur mit rotem Oberflächen-Theme, hat aber zusätzlich ein paar Menüeinträge mehr für EPUB-Metadaten, Pflege einer Kapitelstruktur oberhalb der WordPress-Artikel und kennt ein paar spezielle Seitentypen wie Coverseite, Copyright und Autorenseite. Aber fühlt sich sonst zu 100% wie WordPress an.

Überraschung Nummer 2: Es geht wirklich wahnsinnig schnell. Selbst wenn man Artikel manuell per Copy & Paste in die erste Testsite einfügt, wie ich beim ersten Versuch, beträgt die verwendete Arbeitszeit von erstem Login bis zum ersten fertigen EPUB etwa eine halbe Stunde. Erstaunlich. Und das Ergebnis schaut auch gar nicht so schlecht aus – zwar hat man beim ersten Test ungefähr die Hälfte der eBook-Spezifika vergessen, und das mitgelieferte CSS ist ok, aber nicht spektakulär. Aber der erste Blick ins erzeugte EPUB zeigt: Das konvertierte HTML im EPUB ist straightforward, verständlich und standard-kompatibel, das eingebundene CSS in jeder Hinsicht recht einfach gehalten, und deswegen ausbaufähig. Aber ein paar Kleinigkeiten müssen dennoch im EPUB direkt angepaßt werden und ich habe mir auch noch ein paar Gestaltungsexperimente vorgenommen, deswegen muss das nächste Tool her.

Sigil

Für minimal invasives Arbeiten innerhalb von EPUB-Dateien kann man natürlich schlicht den EPUb-Zip-Container entzippen und per ASCII-Editor wie etwa Notepad++ loslegen (den man auch unabhängig davon auf seiner Kiste haben sollte, wenn man ab und an und in Quelltexten arbeiten muss), dies legt jedoch selbst für den versierten Web-Designer eine Menge Fallstricke: Beim Zippen/Entzippen können Probleme auf Byte-Ebene entstehen, da sich nicht alle Packer gleich verhalten, und da innerhalb von EPUB mehr oder weniger jede relevante Datenstruktur per ID aufeinander referenziert, ist die Chance gross, eine Datei versehentlich invalide zu machen. Das heißt, als nächstes kommt ein Post-Production/Finishing-Tool zum Einsatz.

Als Werkzeug für den EPUB-Heimwerker hat mittlerweile Sigil einen ansehnlichen Reifegrad erreicht: Mit diesem Tool arbeitet man innerhalb der Inhalte des EPUB-ZIP-Containers, ohne dies jedoch so richtig zu merken. Unabhängig vom konkreten Dateisystem innerhalb der EPUB-Datei werden die Content-Dokumente, der TOC, Stylesheets, Bilder und Fonts in immer derselben Baumansicht angezeigt und stehen zur Bearbeitung bereit. Das Arbeiten innerhalb des Content ist WYSIWYG, im HTML-Code oder als Split-View möglich; alle relevanten Arbeiten werden von HTML-Editor-üblichen Komfort-Funktionen unterstützt. Für CSS gibt’s Syntax-Highlights, und das beste: Da sowohl HTML und CSS, als auch die EPUB-internen Strukturen ständig validiert werden, hat man eigentlich kaum eine Chance, etwas falsch zu machen.

Feinschliff am eBook wie etwa generierte englische Texte durch deutsche ersetzen, Ersetzen von Bildreferenzen von Blog-gerechten zu EPUB-gerechten und nicht zuletzt die Einbindung von Web-Fonts im CSS (ich hatte mir etwas Web-Typographie eingebildet) gehen leichter von der Hand als der Aufbau einer stimmigen Dokumentvorlage in Word. Vor 2 Jahren noch eine ziemliche Baustelle, ist Sigil inzwischen ein wirklich solides Werkzeug für Produktioner geworden, die trotz Automatisierung und Generierung von EPUB direkt in den Daten arbeiten müssen oder wollen. Mittlerweile gibt es das Tool sogar mit recht gut gemachter deutscher Lokalisierung, so dass die Hemmschwellen für web-affine Content-Arbeiter ohne Spitzklammer-Phobie kaum niedriger sein könnten.

Web-Fonts

Für die in smart publishing verwendeten Web-Fonts Delicious und Fontin Sans gebührt der Dank dem niederländischen Font-Designer Jos Buivenga und seiner exljbris type foundry. Neben großem Engagement für die Web-Typographie stellt er einige wunderbare Schriftarten zur freien Verfügung bereit, sofern man im CSS auf ihn verweist und verlinkt, bzw. im Klartext des Produktes auf sein Typographie- und Font-Portal hinweist. Was ich hiermit zusammen mit einer großen Empfehlung tue, denn mein erstes Experiment mit Web-Fonts in EPUB gefällt mir ausnehmend gut.

Qualitätskontrolle

Bei der Arbeit mit EPUB-Daten, egal ob direkt im Quellcode, über einen Editor wie Sigil, oder durch Konvertierungswerkzeuge kann es immer wieder zu fehlerhaften Datenstrukturen kommen, die im besten Falle nur in Schönheitsfehlern münden, im schlimmsten Fall die Datei komplett invalide machen, oder die Verwendung in bestimmten Plattformen komplett verhinden. Eine gründliche Qualitätskontrolle gehört deswegen fest zum Berufsethos des EPUB-Produktioners – oder wie schon Charles Goldfarb über SGML-Daten sagte: “Parse me first!”.

Zum Glück stehen auch hier genügend kostenlose und praxiserprobte Tools zur Verfügung: Wird der HTML-Code innerhalb der EPUB-Datei beim Erstellen nicht ohnehin validiert (wie in manchen Workflows selbstverständlich), ist die Verwendung des W3C HTML Validation Service zum Prüfen der Daten Pflicht und bedeutet das Gütesiegel von den Hütern der Webstandards. Gleiches gilt für selbst erstellte CSS-Dateien für die Formatierung des Content: Ohne W3C CSS Validation verläßt keine EPUB-Datei den Produktions-Rechner.

Paßt dann soweit alles bei den Einzeldokumenten, sollte dennoch eine Endkontrolle mittels dem von Adobe entwickelten und mittlerweile als Google Code Projekt gehosteten epubcheck erfolgen. Das Tool prüft alle internen Datenstrukturen, die eine valide EPUB-Datei ausmachen und gibt dem Herausgeber die nahezu 100%ige Sicherheit, eine standard-konforme EPUb-Datei auszuliefern. epubcheck ist in der Standard-Version wieder einmal ein Kommandozeilen-Werkzeug – wer hier Berührungsängste hat: In funktional identischer Form hostet das IDPF mittlerweile einen Webservice für epubcheck, und wer lieber Desktop-basiert arbeitet, für den hat der Tübinger XML- und Publishing-Dienstleister pagina eine Windows-Anwendung darüber gebaut und bietet diese zum kostenlosen Download an. Danke, liebe Leute von pagina!

Erzeugung von Ökosystem-spezifischen Varianten

Für das Lesen auf eInk-Readern wie dem Sony Reader bzw. seinen mittlerweile unzählbaren Klonen und Low-Cost-Varianten sowie am PC über Adobe Digital Editions oder andere EPUB-Reader für den Desktop genügt es zunächst, eine per epubcheck validierte Standard-EPUB-Datei nach der IDPF-Spezifikation für ePub 2.0.1 zu erstellen. Gleiches gilt für die Belieferung der deutschen eBook-Marketplaces wie Ciando, Libri, Libreka, etc.

Für Apple gilt dies leider nur, wenn man sich an den einfachsten denkbaren Dateiaufbau hält. Für die Adressierung von iBooks-spezifischen Funktionen muss die Datei zusätzlich modifiziert werden. In unserem Fall führen die eingebetteten Webfonts dazu, dass eine zusätzliche XML-Konfigurationsdatei für iBooks ins EPUB integriert werden muss, in der die Optionen für die Verwendung der Fonts gesetzt werden – erst dann erklärt sich iBooks bereit, die mitgelieferten Fonts auch wirklich anzuzeigen. Für das Apple-Ökosystem ist der regelmäßig aktualisierte iBookstore Asset Guide die zentrale Referenz – der allerdings aus mir unverständlichen Gründen von Apple selbst nicht zum freien Download angeboten wird. Googeln verhilft jedem Suchenden aber über kurz oder lang zu einer Dateiquelle, für die Stand Mai 2012 aktuelle Version 4.8 zum Beispiel hier.

Trotz der erheblichen Verbesserungen seiner Reader-Software in 2012 und des Updates seiner Technik-Landschaft auf KF8 bleibt Amazon beim Prinzip, EPUB in seinen Kindle Readern nicht direkt anzuzeigen. Hier muss immer konvertiert werden in ein weiteres Proprietär-Format, das nun KF8 statt Mobipocket heißt (allerdings immer noch die Dateiendung .mobi hat). Für diesen Zweck ist Kindlegen als Konverter nach KF8 ist als Kommandozeilen-Werkzeug direkt bei Amazon zu beziehen und bedient sich quasi selbsterklärend, sofern man das Arbeiten auf der Kommandozeile gewohnt ist.

Unbedingt zu empfehlen bei der Erzeugung einer Kindle-Variante ist der Einsatz des Kindle Previewer, einem weiteren Produktioner-Tool von Amazon. Die vom KF8-Konverter erzeugten Dateien können hier am Desktop vorab visuell geprüft werden. Das Tool kann dabei die verschiedenen Kindle-Varianten und den Kindle Fire emulieren und gibt vorab einen guten Eindruck, wie ein eBook über die verschiedenen Kombinationen von Displays und Firmware-Versionen hinweg dargestellt wird. Der in der Präsentation von KF8 durch Amazon angekündigte Verbesserungs-Schritt beim standard-konformen Anzeigen von XHTML und CSS bestätigt sich bei diesem Projekt: In der Fire-Simulation sieht das eBooks nahezu 1:1 aus wie in den anderen Reader-Plattformen.

Wie das Google-Ökosystem für eBooks einmal aussehen wird, ist bisher nur zu erahnen, wenn man sich die Web-Präsentationen zu Google Play in der US-Lokalisierung anschaut. Einen guten Eindruck von eBooks in Play gibt aber der momentane Zustand des Readium-EPUB-Readers: Dieses vom IDPF getragene und von Google gesponserte Open Source-Projekt für eine Referenz-Implementierung von EPUB3 als Chrome-Plugin soll einmal die Reader-Komponente des eBook-Anteils von Play werden. Die EPUB3-Anzeige ist zwar noch weit von der Fertigstellung entfernt, aber ein ePub 2.0 wird bereits sehr ordentlich dargestellt und gibt dem Produktioner einen guten Eindruck, ob hier noch einmal grundlegende Dinge im eBook getan werden müssen.

Für eine sehr nützliche Zusammenstellung über Feinschliff und Qualitätssicherung für die verschiedenen Ökosysteme, Reader und EPUB-Varianten, was alles zu beachten ist bzw. ein potienzieller Fallstrick sein kann, empfiehlt sich dazu ein Blick in die Präsentation “ePub Finishing Touches – Fixing Errors, Adding Metadata, and Tweaking Formatting” der eBook Architects (Präsentation für die TOC conference 2011).

Resümee

Mit allen genannten Werkzeugen ist die Erzeugung eines EPUB wie smart publishing wirklich ein Kinderspiel, vor allem für einen Electronic-Publishing-erfahrenen Projektleiter, der sich noch vor 2 Jahren mit schlechten Tools auf Quellcode-Ebene durch jede einzelne EPUB-Komponente kämpfen mußte. Zeitbedarf für das Produzieren der EPUB-Datei von Beginn bis Imprimatur: Kein ganzer Tag Arbeit, Gestaltungsexperimente mit den Fonts eingeschlossen. Von meiner Seite aus: Große Empfehlung für jeden WordPress-Blogger, Kleinverlag mit großen Ambitionen und wenig Budget, und natürlich für alle Selfpublisher, denn die hier genannten Werkzeuge sind unter Open Source-Lizenz verfügbar und damit auch im kommerzialen Einsatz kostenlos nutzbar. Und wer dies gerne tun würde, aber das nötige Know How nicht hat – der wende sich vertrauensvoll an www.smart-digits.com.

Veröffentlicht von

www.dpc-consulting.de

XML- und Digital-Publishing-Professional mit Leib & Seele, seit Berufseinstieg in verschiedensten Projekten rund um Content-Management und Datenbank-basiertes Publizieren unterwegs. Seit 2012 selbständig als Berater und Trainer für digitales Publizieren.