• 25.04.2024, 14:46
  • Registrieren
  • Anmelden
  • Sie sind nicht angemeldet.

 

Lieber Besucher, herzlich willkommen bei: Aqua Computer Forum. Falls dies Ihr erster Besuch auf dieser Seite ist, lesen Sie sich bitte die Hilfe durch. Dort wird Ihnen die Bedienung dieser Seite näher erläutert. Darüber hinaus sollten Sie sich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutzen Sie das Registrierungsformular, um sich zu registrieren oder informieren Sie sich ausführlich über den Registrierungsvorgang. Falls Sie sich bereits zu einem früheren Zeitpunkt registriert haben, können Sie sich hier anmelden.

doc, pdf... ->plain text unter Linux

Mittwoch, 1. Juni 2005, 19:17

hi,
ich suche ein tool, das den text aus (MS)office dokumenten und pdf extrahieren kann.
es muss unter linux laufen, ausserdem zuverlässig und stabil (braucht keine freeware sein).

hat da jmd nen tipp?

Re: doc, pdf... ->plain text unter Linux

Mittwoch, 1. Juni 2005, 19:30

soll des automatisch passieren?
Wenn nein für die docs openoffice
Für die pdf ?? keine ahnung ;-)

Re: doc, pdf... ->plain text unter Linux

Mittwoch, 1. Juni 2005, 19:33

das prog sollte per per commandzeile aufgerufen werden können (von einem anderen prog, das den plaintext braucht)

LaNcom

Senior Member

Re: doc, pdf... ->plain text unter Linux

Mittwoch, 1. Juni 2005, 20:29

PDF: pdftotext (gehört zu xpdf) - http://www.foolabs.com/xpdf/
DOC: wvText (Teil der wv Utilities) - http://wvware.sourceforge.net/#wv
"Computer games don't affect kids; I mean if Pac-Man affected us as kids, we'd all be running around in darkened rooms, munching magic pills and listening to repetitive electronic music." -- Kristian Wilson, Nintendo, Inc, 1989.