Konvertieren Sie PDF-Text in Audio-Sprache mit Python
Lassen Sie uns sehen, wie Sie ein PDF lesen, das eine Text-PDF-Datei in Audio konvertiert.
Verwendete Pakete:
- pyttsx3: Es ist eine Python-Bibliothek für Text to Speech. Es hat viele Funktionen, die der Maschine helfen, mit uns zu kommunizieren. Es wird der Maschine helfen, mit uns zu sprechen
- PyPDF2: Es hilft beim Text aus dem PDF. Eine Pure-Python-Bibliothek, die als PDF-Toolkit erstellt wurde. Es ist in der Lage, Dokumentinformationen zu extrahieren, Dokumente Seite für Seite aufzuteilen, Dokumente Seite für Seite zusammenzuführen usw.
Beide Module müssen installiert werden
pip install pyttsx3 Pip installieren PyPDF2
Sie müssen auch die Funktion open() kennen, mit der wir die PDF-Datei im Lesemodus öffnen können. Kenntnisse über das OOPS-Konzept werden ebenfalls empfohlen.
Hier ist der Link der PDF-Datei, die im Beispiel gelesen wird: https://drive.google.com/file/d/1zhf7-_v6CVUtgd_XMK562mg6ciewi1QR/view?usp=sharing
Ansatz:
- Importieren Sie die Module PyPDF2 und pyttx3.
- Öffnen Sie die PDF-Datei.
- Verwenden Sie PdfFileReader() , um das PDF zu lesen. Wir müssen nur den Pfad des PDF als Argument angeben.
- Verwenden Sie die Methode getPage() , um die zu lesende Seite auszuwählen.
- Extrahieren Sie den Text mit extractText() von der Seite .
- Instanziieren Sie ein pyttx3-Objekt.
- Verwenden Sie die Methoden say() und runwait() , um den Text auszusprechen .
Nun hier der Code dafür
import
PyPDF2
import
pyttsx3
path
=
open
(
'file.pdf'
,
'rb'
)
pdfReader
=
PyPDF2.PdfFileReader(path)
from_page
=
pdfReader.getPage(
24
)
text
=
from_page.extractText()
speak
=
pyttsx3.init()
speak.say(text)
speak.runAndWait()
Ausgabe: