Homepage von html2text

Verwandte Seiten:

html2text ist ein C++-Programm für die Kommandozeile, das HTML-Dateien in reinen Text umwandelt.

Die HTML-Dateien können von Standard-Input gelesen werden, als lokale Dateien vorliegen oder über Hypertext Transfer Protocol (HTTP) von anderen Rechnern geladen werden; die Ausgabe erfolgt auf Standard-Output oder in eine Datei.

html2text setzt Tabellen möglichst getreu um, besitzt eine Möglichkeit zum Einstellen der Länge der Ausgabe-Zeilen und toleriert auch syntaktisch unkorrektes HTML. Unterstrichener und/oder fetter Text wird standardmäßig durch so genannte Backspace-Sequenzen wiedergegeben, die von Pager-Programmen wie "less" entsprechend umgesetzt werden. Dabei ist die Art der Umsetzung ursprünglicher Formatierungen (Rendering) weitgehend durch eine Konfigurationsdatei beeinflussbar.

html2text wird unter Linux entwickelt und getestet, kann aber auch unter anderen UNIX-Plattformen eingesetzt werden, wie AIX, FreeBSD, IRIX, NetBSD und SINIX. Außerdem wird der erfolgreiche Einsatz unter Cygwin und Fink berichtet.

html2text wurde bis Version 1.2.2 von Arno Unkrig für GMRS geschrieben. Dort hat man die Entwicklung und den Vertrieb dieses Programms eingestellt, aber einer Änderung der Lizenbedingungen zugestimmt, weshalb es jetzt hier unter den Bedingungen der GNU General Public License zum Download zur Verfügung steht. Das Programm kommt mit einer englischsprachigen Dokumentation.

Version 1.3.2 ist in zwei Varianten erhältlich: 1.3.2a enthält Änderungen, die für modernere Compiler (wie die jüngsten Versionen des gcc) benötigt werden, während 1.3.2 für ältere Compiler geeignet ist.

Download-Möglichkeiten für den Quelltext von html2text sowie Links zu Binär-Paketen finden Sie auf der Download-Seite des Programms. Sie können den Quelltext der jüngsten Version auch direkt von Ibiblio beziehen.

Weitere Informationen zu html2text und zu seiner Entwicklung finden Sie in der Programm-Dokumentation (englisch) und dem Changes Log (englisch) des Programms. Wenn Sie auf Probleme treffen, die nicht auf der Known Bugs-Seite (englisch) des Programms beschrieben sind, lesen Sie bitte zunächst die Sammlung von Fragen und Antworten (englisch) zu html2text und konsultieren Sie bitte außerdem auch immer die html2text(1) und html2textrc(5) Manual Pages (englisch). Außerdem steht eine Seite mit Beispielen (englisch) für html2textrc-Konfigurationsdateien zur Verfügung.

Dieses Programm ist freie Software. Bitte helfen Sie mit, es vor Softwarepatenten zu schützen, indem Sie die FFII unterstützen.