Zum Hauptinhalt springen

HTML- und SVG-Export

Der Webservice "Toolbox" mit den Operationen image und transcribe erlaubt die Erzeugung eines HTML- oder SVG-Abbilds eines PDF Dokuments.

API {REST}: toolbox

Die Operationen sollen PDF Inhalte möglichst verlustfrei und präzise in das Zielformat überführen.

Vorsicht

Gerade bei der Abbildung von Farbverläufen, Mustern und Schattierungen kann es hierbei stets zu Qualitätsverlusten und kleineren Ungenauigkeiten bei der Positionierung kommen. Auch die Übersetzung der verschiedenen Schriftarten ist grundsätzlich fehleranfällig, gerade wenn hierbei auf eine Ersatzschriftart zurück gefallen werden muss (beispielsweise für die PDF-14 Standard-Schriftarten). Das Ergebnis sollte daher möglichst gesichtet und auf Abweichungen geprüft werden!

Operation "**transcribe"

Die transcribe Operation kann genutzt werden, um eine oder mehrere Seiten des PDFs in ein zusammenhängendes HTML Dokument zu überführen. Hierbei werden Pfadzeichenanweisungen in entsprechende SVG Zeichenpfade übersetzt, Schrifarten und Rastergrafiken nach Möglichkeit extrahiert und direkt in das entstehende Dokument eingebettet und die Rahmen und Dimensionen der Seiten mittels entsprechender Container abgebildet.

Texte werden möglichst mittels der ermittelten Schriftarten dargestellt, sodass textuelle Inhalte selektierbar und erhalten bleiben.

Für die Abbildung komplexerer Zeichenoperationen wie Farbverläufen, Muster und Schattierungen werden hierbei grundsätzlich Rastergrafiken erzeugt, wodurch es zu Ungenauigkeiten und Qualitätsverlusten kommen kann.

Anmerkungen / Einschränkungen
  • Die transcribe Operation unterstützt derzeit den Export von nicht Unicode fähigen Fonts nicht. Nur Schriftarten, deren Glyphen sich auf Unicode abbilden lassen, können korrekt dargestellt werden, Textinhalte ohne Unicode Abbildung werden im entstehenden Dokument fehlen.
    Dies betrifft vor allem Type1 und Type3 Postscript Schriftarten und einige CFF Schriften, sollten diese über eine entsprechende Tabelle nicht verfügen.
  • Sämtliche Angaben bezüglich der Auflösung des Ergebnisses beziehen sich vor allem und maßgeblich auf die verwendeten oder zu erzeugenden Rastergrafiken.

Operation "image"

Der SVG Export der image Operation verhält sich sehr ähnlich wie die transcribe Operation. Pfadzeichenanweisungen werden möglichst präzise in das SVG übernommen, komplexere Zeichenoperationen wie Farbverläufe, Muster und ähnliches, werden in Rastergrafiken überführt.

::caution Anmerkungen / Einschränkungen

  • Schriftarten allerdings werden hierbei in keinem Fall übersetzt oder eingebettet - enthaltene textliche Inhalte werden direkt in Glyph-Zeichenpfade übertragen und werden damit definitiv im Ergebnis enthalten sein. Allerdings geht hierbei sowohl die Selektierbarkeit der Glyphen, als auch deren Unicode Zuordnung natürlich verloren.
    :::