• 24.04.2024, 06:31
  • Registrieren
  • Anmelden
  • Sie sind nicht angemeldet.

 

doc, pdf... ->plain text unter Linux

Mittwoch, 1. Juni 2005, 19:17

hi,
ich suche ein tool, das den text aus (MS)office dokumenten und pdf extrahieren kann.
es muss unter linux laufen, ausserdem zuverlässig und stabil (braucht keine freeware sein).

hat da jmd nen tipp?

Re: doc, pdf... ->plain text unter Linux

Mittwoch, 1. Juni 2005, 19:30

soll des automatisch passieren?
Wenn nein für die docs openoffice
Für die pdf ?? keine ahnung ;-)

Re: doc, pdf... ->plain text unter Linux

Mittwoch, 1. Juni 2005, 19:33

das prog sollte per per commandzeile aufgerufen werden können (von einem anderen prog, das den plaintext braucht)

LaNcom

Senior Member

Re: doc, pdf... ->plain text unter Linux

Mittwoch, 1. Juni 2005, 20:29

PDF: pdftotext (gehört zu xpdf) - http://www.foolabs.com/xpdf/
DOC: wvText (Teil der wv Utilities) - http://wvware.sourceforge.net/#wv
"Computer games don't affect kids; I mean if Pac-Man affected us as kids, we'd all be running around in darkened rooms, munching magic pills and listening to repetitive electronic music." -- Kristian Wilson, Nintendo, Inc, 1989.