Sie sind hier: Startseite >> Tipps & Downloads >> Tipps für den "Selbstvollender" - Teil 8
 
 

Einfache und nützliche Tipps für den "Selbstvollender" - Teil 8

 

Wie erzeugt man schlankes HTML aus Word-Dateien ?

1. Bei einem Einzeldokument mit überwiegend einfachen Textblöcken und wenigen Bildern dazwischen kopiert man beispielsweise die Inhalte einzelner Absätze in die Zwischenablage und fügt diese dann zuerst in einen Texteditor (wie z.B. Notepad, Wordpad oder Editpad) ein. Damit hat man die spezifischen Formatierungen des Word-Dokuments entfernt, welche ansonsten mit übernommen werden würden. Anschließend kopiert man die formatfreien Inhalte aus dem Texteditor entweder in den WYSIWYG-Editor oder bei Festlegung von "UTF-8" als Charset-Einstellung im Meta-Tag bei "Content-Type" auch direkt in den Quellcode.

Dreamweaver bietet ab Version 8 ein leistungstarkes Import-Modul für Office-Dokumente und auch in den älteren Versionen ein Word-HTML-Optimierungs-Modul an. Mit dem Import-Modul kann man den oben beschriebenen Weg über die Zwischenablage umgehen.

Word-Import mit Dreamweaver 8   Word-Optimierung mit Dreamweaver

zur Vergrößerung bitte auf das jeweilige Bild klicken

 

2. Bilder, die in Word eingebettet sind, sollte man nicht per Cut & Paste in einen WYSIWYG-Editor einfügen, da diese Bilder meistens zu großformatig sind. Besser ist es, den Word-Abschnitt, in dem das Bild eingebttet ist, abzufotografieren (als Screenshot, geht z.B. mit Irfanview, s. Bilder unten) und diesen Screenshot nachträglich zu bearbeiten. Somit erhält man ein Bild mit Internet gerechter Auflösung und Dateigröße.

Screenshot erstellen mit Irfanview   Screenshot erstellen mit Irfanview

zur Vergrößerung bitte auf das jeweilige Bild klicken

 

3. Liegt ein komplizierter und umfangreich formatierter Text mit vielen Sonderzeichen sowie Hoch- und Tiefstellungen in Word vor, wie z.B. bei einer Liste mit wissenschaftlichen Publikationen, nachstehend ein Beispiel mit nur einem typischen Literaturzitat,

25.  Synthesis and characterization of synthetically useful salts of the weakly-coordinating
        dianion [B12Cl12]2-
        Vanessa Geis, Kristin Guttsche, Carsten Knapp, Harald Scherer, Rabiya Uzun
        Dalton Trans. 2009, 2687-2694, DOI: 10.1039/B821030F

so kommt man mit Cut & Paste wie oben beschrieben nicht mehr weiter.

Eine Word-Datei lässt sich problemlos direkt als HTML-Seite abspeichern. Dieser mittels Word- Konvertierung erzeugte HTML-Quellcode ist jedoch extrem aufgebläht und erhöht somit unnötig die Ladezeit im Browser. Falls im Word-Dokument eine andere Schrift als z.B. Arial eingestellt ist, dann sollte vor Abspeicherung noch die Schrift und die Schriftgröße für das Gesamtdokument angepasst werden.

Hat man bereits Word-HTML vorliegen, so lässt sich mit dem Dreamweaver-Optimierungstool (s. Bild oben) auf einfache Weise schlanker HTML-Quellcode erzeugen. Dieser deutlich schlankere Quellcode kann danach mit wenig Aufwand von Hand nachbearbeitet werden.

Weitere Möglichkeiten

Microsoft stellt selbst ein eigenes Filter-Tool zur Verfügung, mit dem sich Word-HTML-Overhead per Batch-Konvertierung reduzieren lässt. "Office HTML-Filter" ist ein Tool, mit dem sich Office spezifische Markup-Tags aus Office 2000-Dokumenten im HTML-Format entfernen lassen. Das Programm kann kostenlos von der Seite http://www.office.microsoft.com/downloads/2000/Msohtmf2.aspx herunter geladen werden.

Wer nicht auf Microsoft-Produkte steht, findet unter dem kostenpflichtigen "RTFC Hypertext Compiler" das leistungsfähigste Tool zum intelligenten Konvertieren umfangreicher Dokumentensammlungen in eine Website. Der Preis für das Grundmodul RTFC Personal Edition beträgt derzeit 50,00 EUR. Der RTFC Hypertext Compiler kann unter http://www.rtfc.de als Desktop-Anwendung heruntergeladen werden.

Online-Konvertierungstool

Bei großen und/oder komplexen Dokumenten kann man durch Verwendung des Online-Tools "HTML Tidy" den Umstellungsaufwand in Grenzen halten und das Dokument mit Formatierungen übernehmen.
Dabei kann man wie folgt vorgehen:

  • Das Office-Dokument als Webseite abspreichern.
  • Die Seite "http://www.infohound.net/tidy/ " aufrufen.
  • auf den Link "Advanced" klicken.
  • Die angespeicherte Webseite als Upload auswählen.
  • Die Checkboxen "Clean" und "Word 2000" sowie die Checkbox "Output XHTML" aktivieren.
  • Als Character input encoding "win1252", als Character output encoding "utf8" auswählen.
  • "Tidy link" betätigen.

Als Resultat erhält man eine XHTML-konforme Webseite, bei der die ausgiebige Formatierung von Office entfernt wurde. Dieses Dokument kann heruntergeladen werden und mit einem UTF-8 fähigen Editor nachbearbeitet werden. Der Quelltext kann in der Regel nach geringen Modifikationen in einem Editor mit Cut & Paste übernommen werden.

 

zur Sitemap

 

nach oben ©  web's tool | Seite Drucken