Strings aus einer Powerpoint-Datei auslesen

Hallo!

Ich steh im Moment vor folgender Aufgabe: Alle Strings aus einer
Powerpoint-Datei auslesen und in einer Textdatei abspeichern.

Das ganze soll unter Windows laufen.

Gibt's sowas schon?

LG,
Christian
Christian Aigner [ Di, 21 August 2007 15:31 ] [ ID #1801522 ]

Re: Strings aus einer Powerpoint-Datei auslesen

Christian Aigner wrote:
> Gibt's sowas schon?

In PHP stelle ich mir das ziemlich schwer vor, da es sich um ein
bei der PP-Datei um eine Binärdatei handelt.

Im Web gibt es hunderte PP-to-Text konverter.

Ein Workaround (ziemlich schlecht): Alle PP-Seiten in eine PDF
Datei drucken, dann in Text wandeln (gibt es Freeware-Tools und
viele PHP-Skripte) und dann weiterverarbeiten.
Tobias Wendorff [ Di, 21 August 2007 15:33 ] [ ID #1801523 ]

Re: Strings aus einer Powerpoint-Datei auslesen

Tobias Wendorff <tobwenSPAM [at] gmx.de> wrote:
> Ein Workaround (ziemlich schlecht): Alle PP-Seiten in eine PDF
> Datei drucken, dann in Text wandeln (gibt es Freeware-Tools und
> viele PHP-Skripte) und dann weiterverarbeiten.

Kann man Powerpoint nicht auch in (Pseudo-)HTML von M$ umwandeln?

Hatte mal sowas geliefert bekommen. Läuft nur im IE und mit
ActiveX-Kram, aber es lagen definitiv HTML-ähnliche Dateien im
Verzeichnis.


--
Web (en): http://www.no-spoon.de/ -*- Web (de): http://www.frell.de/
Stefan Scholl [ Di, 21 August 2007 16:04 ] [ ID #1801527 ]

Re: Strings aus einer Powerpoint-Datei auslesen

Stefan Scholl schrieb:
> Kann man Powerpoint nicht auch in (Pseudo-)HTML von M$ umwandeln?

Wahrscheinlich möchte der OP das Ganze ohne Zwischenschritte
automatisieren. Da es sich bei PPT-Dateien aber um ein proprietäres
Dateiformat handelt, wird das wohl schwer werden (außer M$ wirft eine
PHP-Extension dafür auf den Markt SCNR).


Gruß,
Habbo
bruening [ Di, 21 August 2007 16:05 ] [ ID #1801530 ]

Re: Strings aus einer Powerpoint-Datei auslesen

Jan Habbo Brüning <bruening [at] menke.de> wrote:
> Stefan Scholl schrieb:
>> Kann man Powerpoint nicht auch in (Pseudo-)HTML von M$ umwandeln?
>
> Wahrscheinlich möchte der OP das Ganze ohne Zwischenschritte
> automatisieren. Da es sich bei PPT-Dateien aber um ein proprietäres
> Dateiformat handelt, wird das wohl schwer werden (außer M$ wirft eine
> PHP-Extension dafür auf den Markt SCNR).

Oder man sieht im Code von OpenOffice.org (oder anderen
Programmen die Powerpoint importieren können) nach.

Für Java gibt es hier was: http://poi.apache.org/hslf/index.html


--
Web (en): http://www.no-spoon.de/ -*- Web (de): http://www.frell.de/
Stefan Scholl [ Di, 21 August 2007 16:57 ] [ ID #1801537 ]

Re: Strings aus einer Powerpoint-Datei auslesen

Am Tue, 21 Aug 2007 15:33:37 +0200, schrieb "Tobias Wendorff"
<tobwenSPAM [at] gmx.de>:

> Christian Aigner wrote:
> > Gibt's sowas schon?
>
> In PHP stelle ich mir das ziemlich schwer vor, da es sich um ein
> bei der PP-Datei um eine Binärdatei handelt.
>
> Im Web gibt es hunderte PP-to-Text konverter.
>
> Ein Workaround (ziemlich schlecht): Alle PP-Seiten in eine PDF
> Datei drucken, dann in Text wandeln (gibt es Freeware-Tools und
> viele PHP-Skripte) und dann weiterverarbeiten.

Danke für den Tip und auch die anderen Wortmeldungen. Ich hab schon
ein paar kommerzielle Produkte gefunden. Ob die geeignet sind, muß ich
mir aber erst ansehen.

Die PP zuerst in PDF drucken ist leider keine Option.

mfg,
Christian
Christian Aigner [ Mi, 22 August 2007 13:09 ] [ ID #1802503 ]
PHP » de.comp.lang.php.misc » Strings aus einer Powerpoint-Datei auslesen

Vorheriges Thema: Weiterleitung bei nichtvorhandener Directory
Nächstes Thema: Icons anzeigen