Lassen Sie uns sehen, wie Sie ein PDF lesen, das eine Text-PDF-Datei in Audio konvertiert.

Verwendete Pakete:

  • pyttsx3: Es ist eine Python-Bibliothek für Text to Speech. Es hat viele Funktionen, die der Maschine helfen, mit uns zu kommunizieren. Es wird der Maschine helfen, mit uns zu sprechen
  • PyPDF2: Es hilft beim Text aus dem PDF. Eine Pure-Python-Bibliothek, die als PDF-Toolkit erstellt wurde. Es ist in der Lage, Dokumentinformationen zu extrahieren, Dokumente Seite für Seite aufzuteilen, Dokumente Seite für Seite zusammenzuführen usw.

Beide Module müssen installiert werden

pip install pyttsx3
Pip installieren PyPDF2

Sie müssen auch die Funktion open() kennen, mit der wir die PDF-Datei im Lesemodus öffnen können. Kenntnisse über das OOPS-Konzept werden ebenfalls empfohlen.

Hier ist der Link der PDF-Datei, die im Beispiel gelesen wird: https://drive.google.com/file/d/1zhf7-_v6CVUtgd_XMK562mg6ciewi1QR/view?usp=sharing



Ansatz:

  • Importieren Sie die Module PyPDF2 und pyttx3.
  • Öffnen Sie die PDF-Datei.
  • Verwenden Sie PdfFileReader() , um das PDF zu lesen. Wir müssen nur den Pfad des PDF als Argument angeben.
  • Verwenden Sie die Methode getPage() , um die zu lesende Seite auszuwählen.
  • Extrahieren Sie den Text mit extractText() von der Seite .
  • Instanziieren Sie ein pyttx3-Objekt.
  • Verwenden Sie die Methoden say() und runwait() , um den Text auszusprechen .

Nun hier der Code dafür

import PyPDF2 
import pyttsx3 
  
path = open('file.pdf', 'rb') 
  
pdfReader = PyPDF2.PdfFileReader(path) 
  
from_page = pdfReader.getPage(24) 
  
text = from_page.extractText() 
  
speak = pyttsx3.init() 
speak.say(text) 
speak.runAndWait()

Ausgabe: