Powerpoint-.ppt-Datei lesen

Ich suche nach einer Lösung zum Lesen von .pptDateien (der alte Typ, NOT .pptx) vorzugsweise mit der Programmiersprache R. Wenn es keine gibt, wären auch andere Lösungen (z. B. mit Python) willkommen. Ich brauche im Grunde nur den Text in der .pptDatei.

Ich suche hauptsächlich nach Bibliotheken, aber jede einfache Open-Source-Lösung wäre hilfreich.

Antworten (2)

Zu lang für einen Kommentar, also werde ich als Antwort posten, obwohl es nicht genau das ist, wonach Sie fragen, Teile davon sollten akzeptabel sein.

Wenn Sie keine Lösung finden, was wahrscheinlich erscheint, weil MS dazu neigte, ihre proprietären Binärformate sehr privat zu halten, geben Sie nicht auf.

Mach einfach das, was ich ohnehin schon getan hätte; Wenn es kein Inkompatibilitätsproblem gibt, was unwahrscheinlich ist, nehmen Sie eine Kopie der Datei, importieren Sie diese in PowerPoint, lassen Sie sie von PP in PPTX konvertieren und speichern Sie sie. Verarbeiten Sie das mit R oder Python (Sie können den Import/Speichern unter-Vorgang auch automatisieren).

Wenn Sie keinen Zugriff auf PowerPoint haben, hat Libre Office gute Chancen, die Arbeit zu erledigen.

Wenn das fehlschlägt, kaufe ich regelmäßig Windows- und Office-Lizenzschlüssel bei eBay. Letzten Monat habe ich 12 US-Dollar für MS Office Pro bezahlt.

Wenn das zu teuer ist, ist es einfach, sich als Microsoft-Entwickler anzumelden, Sie müssen nur ein Projekt vorschlagen, das Sie mit ihren Tools entwickeln möchten, und sie geben Ihnen Office 365 für ein Jahr kostenlos (wahrscheinlich leicht erneuerbar).

Wenn nichts davon funktioniert, dann bist du SOL und nicht schlechter dran als zu Beginn :-/

HTH, viel Glück :-)

Ich habe eine Lösung gefunden, die für mich gut genug funktioniert. Es ist nicht superschnell, wenn Sie eine große Anzahl von Dokumenten haben, aber zumindest funktioniert es. Es konvertiert PPT-Dateien in PDFs und Sie können dann jede Programmiersprache verwenden, um den Text zu extrahieren. Weitere Informationen finden Sie hier https://community.esri.com/thread/179174