Ich würde zunächst einmal schauen, in welchem Format die Tonspur vorliegt. Wenn es bereits ein MP3 ist, kannst Du Dir die Konvertierung nach wav sparen.
Mit VirtualDubMod kannst Du die Tonspur unter Streams -> Stream List mit der Funktion Demux extrahieren.