• 19.07.2025, 02:22
  • Register
  • Login
  • You are not logged in.

 

AngryC

Full Member

doc, pdf... ->plain text unter Linux

Wednesday, June 1st 2005, 7:17pm

hi,
ich suche ein tool, das den text aus (MS)office dokumenten und pdf extrahieren kann.
es muss unter linux laufen, ausserdem zuverlässig und stabil (braucht keine freeware sein).

hat da jmd nen tipp?

nixxxo

Full Member

Re: doc, pdf... ->plain text unter Linux

Wednesday, June 1st 2005, 7:30pm

soll des automatisch passieren?
Wenn nein für die docs openoffice
Für die pdf ?? keine ahnung ;-)

AngryC

Full Member

Re: doc, pdf... ->plain text unter Linux

Wednesday, June 1st 2005, 7:33pm

das prog sollte per per commandzeile aufgerufen werden können (von einem anderen prog, das den plaintext braucht)

LaNcom

Senior Member

Re: doc, pdf... ->plain text unter Linux

Wednesday, June 1st 2005, 8:29pm

PDF: pdftotext (gehört zu xpdf) - http://www.foolabs.com/xpdf/
DOC: wvText (Teil der wv Utilities) - http://wvware.sourceforge.net/#wv
"Computer games don't affect kids; I mean if Pac-Man affected us as kids, we'd all be running around in darkened rooms, munching magic pills and listening to repetitive electronic music." -- Kristian Wilson, Nintendo, Inc, 1989.