• 25.06.2026, 19:55
  • Registrieren
  • Anmelden
  • Du bist nicht angemeldet.

 

Lieber Besucher, herzlich willkommen bei: Aqua Computer Forum. Falls dies dein erster Besuch auf dieser Seite ist, lese dir bitte die Hilfe durch. Dort wird dir die Bedienung dieser Seite näher erläutert. Darüber hinaus solltest du dich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutze das Registrierungsformular, um dich zu registrieren oder informiere dich ausführlich über den Registrierungsvorgang. Falls du dich bereits zu einem früheren Zeitpunkt registriert hast, kannst du dich hier anmelden.

AngryC

Full Member

doc, pdf... ->plain text unter Linux

Mittwoch, 1. Juni 2005, 19:17

hi,
ich suche ein tool, das den text aus (MS)office dokumenten und pdf extrahieren kann.
es muss unter linux laufen, ausserdem zuverlässig und stabil (braucht keine freeware sein).

hat da jmd nen tipp?

nixxxo

Full Member

Re: doc, pdf... ->plain text unter Linux

Mittwoch, 1. Juni 2005, 19:30

soll des automatisch passieren?
Wenn nein für die docs openoffice
Für die pdf ?? keine ahnung ;-)

AngryC

Full Member

Re: doc, pdf... ->plain text unter Linux

Mittwoch, 1. Juni 2005, 19:33

das prog sollte per per commandzeile aufgerufen werden können (von einem anderen prog, das den plaintext braucht)

LaNcom

Senior Member

Re: doc, pdf... ->plain text unter Linux

Mittwoch, 1. Juni 2005, 20:29

PDF: pdftotext (gehört zu xpdf) - http://www.foolabs.com/xpdf/
DOC: wvText (Teil der wv Utilities) - http://wvware.sourceforge.net/#wv
"Computer games don't affect kids; I mean if Pac-Man affected us as kids, we'd all be running around in darkened rooms, munching magic pills and listening to repetitive electronic music." -- Kristian Wilson, Nintendo, Inc, 1989.