Wie wir wissen, ist Python eine geeignete Sprache für Drehbuchautoren und Entwickler. Schreiben wir ein Skript für Voice Assistant mit Python. Die Abfrage für den Assistenten kann je nach Bedarf des Benutzers bearbeitet werden. 
Bei der Spracherkennung wird Audio in Text umgewandelt. Dies wird häufig in Sprachassistenten wie Alexa, Siri usw. verwendet. Python bietet eine API namens SpeechRecognition , mit der wir Audio zur weiteren Verarbeitung in Text konvertieren können. In diesem Artikel werden wir uns mit der Konvertierung großer oder langer Audiodateien in Text mithilfe der SpeechRecognition-API in Python befassen.
 

Module benötigt

 

  • Unterprozess: - Dieses Modul wird zum Abrufen von Systemunterprozessdetails verwendet, die in verschiedenen Befehlen verwendet werden, z. B. Herunterfahren, Ruhezustand usw. Dieses Modul ist in Python integriert. 
     
  • Wolframalpha: - Es wird verwendet, um Antworten auf Expertenebene unter Verwendung der Wolfram-Algorithmen, der Wissensdatenbank und der KI-Technologie zu berechnen. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
     
pip installieren wolframaplha
  •  
  • Pyttsx3: - Dieses Modul wird zur Konvertierung von Text in Sprache in einem Programm verwendet, das offline funktioniert. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
    pip install pyttsx3
     
  • Tkinter: - Dieses Modul wird zum Erstellen der GUI verwendet und wird mit Python geliefert. Dieses Modul ist in Python integriert. 
     
  • Wikipedia: - Wie wir alle wissen, ist Wikipedia genau wie GeeksforGeeks eine großartige Wissensquelle. Wir haben das Wikipedia-Modul verwendet, um Informationen von Wikipedia abzurufen oder eine Wikipedia-Suche durchzuführen. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
     
pip install wikipedia
  •  
  • Spracherkennung: - Da wir eine Anwendung des Sprachassistenten erstellen, ist eines der wichtigsten Dinge dabei, dass Ihr Assistent Ihre Stimme erkennt (dh was Sie sagen / fragen möchten). Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
     
pip install SpeechRecognition
  •  
  • Webbrowser: - So führen Sie eine Websuche durch. Dieses Modul ist in Python integriert. 
     
  • Ecapture: - Zum Aufnehmen von Bildern von Ihrer Kamera. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
     
pip install ecapture
  •  
  • Pyjokes: - Pyjokes wird zum Sammeln von Python-Witzen über das Internet verwendet. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
    Pip installieren Pyjokes
     
  • Datum / Uhrzeit: - Datum und Uhrzeit werden verwendet, um Datum und Uhrzeit anzuzeigen . Dieses Modul ist in Python integriert. 
     
  • Twilio: - Twilio wird zum Tätigen von Anrufen und Nachrichten verwendet. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
     
pip install twilio
  •  
  • Anfragen: Anfragen werden zum Erstellen von GET- und POST-Anfragen verwendet. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
    Pip Installationsanforderungen 
     
  • BeautifulSoup: Beautiful Soup ist eine Bibliothek, mit der Informationen einfach von Webseiten entfernt werden können. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
     
pip install beautifulsoup4
  •  

Hinweis: Sie können einen Teil der Importdatei entfernen, wenn Sie diese Funktion nicht erhalten möchten, wie hier beschrieben. Twilio zum Tätigen von Anrufen und Nachrichten. Wenn Sie diese Funktion nicht verwenden möchten, können Sie diese Funktion einfach entfernen.
 

Implementierung

Importieren Sie die folgenden Bibliotheken.
 

import subprocess
import wolframalpha
import pyttsx3
import tkinter
import json
import random
import operator
import speech_recognition as sr
import datetime
import wikipedia
import webbrowser
import os
import winshell
import pyjokes
import feedparser
import smtplib
import ctypes
import time
import requests
import shutil
from twilio.rest import Client
from clint.textui import progress
from ecapture import ecapture as ec
from bs4 import BeautifulSoup
import win32com.client as wincl
from urllib.request import urlopen

Jetzt setzen wir unsere Engine auf Pyttsx3, das für Text-to-Speech in Python verwendet wird, und sapi5 ist die Microsoft-Plattform für Sprachanwendungsplattformen, die wir für die Text-to-Speech-Funktion verwenden werden.
 

engine = pyttsx3.init('sapi5')
voices = engine.getProperty('voices')
engine.setProperty('voice', voices[1].id)

Sie können die Sprach-ID für männliche Stimme auf „0“ ändern, während Sie den Assistenten verwenden. Hier verwenden wir weibliche Stimme für den gesamten Text in Sprache
 

def speak(audio):
    engine.say(audio)
    engine.runAndWait()
 
def wishMe():
    hour = int(datetime.datetime.now().hour)
    if hour>= 0 and hour<12:
        speak("Good Morning Sir !")
  
    elif hour>= 12 and hour<18:
        speak("Good Afternoon Sir !")   
  
    else:
        speak("Good Evening Sir !"
  
    assname =("Jarvis 1 point o")
    speak("I am your Assistant")
    speak(assname)
     
 
def usrname():
    speak("What should i call you sir")
    uname = takeCommand()
    speak("Welcome Mister")
    speak(uname)
    columns = shutil.get_terminal_size().columns
     
    print("#####################".center(columns))
    print("Welcome Mr.", uname.center(columns))
    print("#####################".center(columns))
     
    speak("How can i Help you, Sir")
 
def takeCommand():
     
    r = sr.Recognizer()
     
    with sr.Microphone() as source:
         
        print("Listening...")
        r.pause_threshold = 1
        audio = r.listen(source)
  
    try:
        print("Recognizing...")    
        query = r.recognize_google(audio, language ='en-in')
        print(f"User said: {query}\n")
  
    except Exception as e:
        print(e)    
        print("Unable to Recognize your voice."
        return "None"
     
    return query
  
def sendEmail(to, content):
    server = smtplib.SMTP('smtp.gmail.com', 587)
    server.ehlo()
    server.starttls()
     
    
    server.login('your email id', 'your email passowrd')
    server.sendmail('your email id', to, content)
    server.close()

Die Hauptfunktion beginnt hier, wir werden jetzt alle diese Funktionen in der Hauptfunktion aufrufen.
 

if __name__ == '__main__':
    clear = lambda: os.system('cls')
     
    
    
    clear()
    wishMe()
    usrname()
     
    while True:
         
        query = takeCommand().lower()
         
        
        
        
        
        if 'wikipedia' in query:
            speak('Searching Wikipedia...')
            query = query.replace("wikipedia", "")
            results = wikipedia.summary(query, sentences = 3)
            speak("According to Wikipedia")
            print(results)
            speak(results)
 
        elif 'open youtube' in query:
            speak("Here you go to Youtube\n")
            webbrowser.open("youtube.com")
 
        elif 'open google' in query:
            speak("Here you go to Google\n")
            webbrowser.open("google.com")
 
        elif 'open stackoverflow' in query:
            speak("Here you go to Stack Over flow.Happy coding")
            webbrowser.open("stackoverflow.com")   
 
        elif 'play music' in query or "play song" in query:
            speak("Here you go with music")
            
            music_dir = "C:\\Users\\GAURAV\\Music"
            songs = os.listdir(music_dir)
            print(songs)    
            random = os.startfile(os.path.join(music_dir, songs[1]))
 
        elif 'the time' in query:
            strTime = datetime.datetime.now().strftime("% H:% M:% S")    
            speak(f"Sir, the time is {strTime}")
 
        elif 'open opera' in query:
            codePath = r"C:\\Users\\GAURAV\\AppData\\Local\\Programs\\Opera\\launcher.exe"
            os.startfile(codePath)
 
        elif 'email to gaurav' in query:
            try:
                speak("What should I say?")
                content = takeCommand()
                to = "Receiver email address"   
                sendEmail(to, content)
                speak("Email has been sent !")
            except Exception as e:
                print(e)
                speak("I am not able to send this email")
 
        elif 'send a mail' in query:
            try:
                speak("What should I say?")
                content = takeCommand()
                speak("whome should i send")
                to = input()    
                sendEmail(to, content)
                speak("Email has been sent !")
            except Exception as e:
                print(e)
                speak("I am not able to send this email")
 
        elif 'how are you' in query:
            speak("I am fine, Thank you")
            speak("How are you, Sir")
 
        elif 'fine' in query or "good" in query:
            speak("It's good to know that your fine")
 
        elif "change my name to" in query:
            query = query.replace("change my name to", "")
            assname = query
 
        elif "change name" in query:
            speak("What would you like to call me, Sir ")
            assname = takeCommand()
            speak("Thanks for naming me")
 
        elif "what's your name" in query or "What is your name" in query:
            speak("My friends call me")
            speak(assname)
            print("My friends call me", assname)
 
        elif 'exit' in query:
            speak("Thanks for giving me your time")
            exit()
 
        elif "who made you" in query or "who created you" in query: 
            speak("I have been created by Gaurav.")
             
        elif 'joke' in query:
            speak(pyjokes.get_joke())
             
        elif "calculate" in query: 
             
            app_id = "Wolframalpha api id"
            client = wolframalpha.Client(app_id)
            indx = query.lower().split().index('calculate') 
            query = query.split()[indx + 1:] 
            res = client.query(' '.join(query)) 
            answer = next(res.results).text
            print("The answer is " + answer) 
            speak("The answer is " + answer) 
 
        elif 'search' in query or 'play' in query:
             
            query = query.replace("search", "") 
            query = query.replace("play", "")          
            webbrowser.open(query) 
 
        elif "who i am" in query:
            speak("If you talk then definately your human.")
 
        elif "why you came to world" in query:
            speak("Thanks to Gaurav. further It's a secret")
 
        elif 'power point presentation' in query:
            speak("opening Power Point presentation")
            power = r"C:\\Users\\GAURAV\\Desktop\\Minor Project\\Presentation\\Voice Assistant.pptx"
            os.startfile(power)
 
        elif 'is love' in query:
            speak("It is 7th sense that destroy all other senses")
 
        elif "who are you" in query:
            speak("I am your virtual assistant created by Gaurav")
 
        elif 'reason for you' in query:
            speak("I was created as a Minor project by Mister Gaurav ")
 
        elif 'change background' in query:
            ctypes.windll.user32.SystemParametersInfoW(20, 
                                                       0, 
                                                       "Location of wallpaper",
                                                       0)
            speak("Background changed succesfully")
 
        elif 'open bluestack' in query:
            appli = r"C:\\ProgramData\\BlueStacks\\Client\\Bluestacks.exe"
            os.startfile(appli)
 
        elif 'news' in query:
             
            try: 
                jsonObj = urlopen()
                data = json.load(jsonObj)
                i = 1
                 
                speak('here are some top news from the times of india')
                print(+ '\n')
                 
                for item in data['articles']:
                     
                    print(str(i) + '. ' + item['title'] + '\n')
                    print(item['description'] + '\n')
                    speak(str(i) + '. ' + item['title'] + '\n')
                    i += 1
            except Exception as e:
                 
                print(str(e))
 
         
        elif 'lock window' in query:
                speak("locking the device")
                ctypes.windll.user32.LockWorkStation()
 
        elif 'shutdown system' in query:
                speak("Hold On a Sec ! Your system is on its way to shut down")
                subprocess.call('shutdown / p /f')
                 
        elif 'empty recycle bin' in query:
            winshell.recycle_bin().empty(confirm = False, show_progress = False, sound = True)
            speak("Recycle Bin Recycled")
 
        elif "don't listen" in query or "stop listening" in query:
            speak("for how much time you want to stop jarvis from listening commands")
            a = int(takeCommand())
            time.sleep(a)
            print(a)
 
        elif "where is" in query:
            query = query.replace("where is", "")
            location = query
            speak("User asked to Locate")
            speak(location)
            webbrowser.open("https://www.google.nl / maps / place/" + location + "")
 
        elif "camera" in query or "take a photo" in query:
            ec.capture(0, "Jarvis Camera ", "img.jpg")
 
        elif "restart" in query:
            subprocess.call(["shutdown", "/r"])
             
        elif "hibernate" in query or "sleep" in query:
            speak("Hibernating")
            subprocess.call("shutdown / h")
 
        elif "log off" in query or "sign out" in query:
            speak("Make sure all the application are closed before sign-out")
            time.sleep(5)
            subprocess.call(["shutdown", "/l"])
 
        elif "write a note" in query:
            speak("What should i write, sir")
            note = takeCommand()
            file = open('jarvis.txt', 'w')
            speak("Sir, Should i include date and time")
            snfm = takeCommand()
            if 'yes' in snfm or 'sure' in snfm:
                strTime = datetime.datetime.now().strftime("% H:% M:% S")
                file.write(strTime)
                file.write(" :- ")
                file.write(note)
            else:
                file.write(note)
         
        elif "show note" in query:
            speak("Showing Notes")
            file = open("jarvis.txt", "r") 
            print(file.read())
            speak(file.read(6))
 
        elif "update assistant" in query:
            speak("After downloading file please replace this file with the downloaded one")
            url = '# url after uploading file'
            r = requests.get(url, stream = True)
             
            with open("Voice.py", "wb") as Pypdf:
                 
                total_length = int(r.headers.get('content-length'))
                 
                for ch in progress.bar(r.iter_content(chunk_size = 2391975),
                                       expected_size =(total_length / 1024) + 1):
                    if ch:
                      Pypdf.write(ch)
                     
        
        elif "jarvis" in query:
             
            wishMe()
            speak("Jarvis 1 point o in your service Mister")
            speak(assname)
 
        elif "weather" in query:
             
            
            
            api_key = "Api key"
            base_url = "http://api.openweathermap.org / data / 2.5 / weather?"
            speak(" City name ")
            print("City name : ")
            city_name = takeCommand()
            complete_url = base_url + "appid =" + api_key + "&q =" + city_name
            response = requests.get(complete_url) 
            x = response.json() 
             
            if x["cod"] != "404": 
                y = x["main"] 
                current_temperature = y["temp"] 
                current_pressure = y["pressure"] 
                current_humidiy = y["humidity"] 
                z = x["weather"] 
                weather_description = z[0]["description"] 
                print(" Temperature (in kelvin unit) = " +str(current_temperature)+"\n atmospheric pressure (in hPa unit) ="+str(current_pressure) +"\n humidity (in percentage) = " +str(current_humidiy) +"\n description = " +str(weather_description)) 
             
            else: 
                speak(" City Not Found ")
             
        elif "send message " in query:
                
                account_sid = 'Account Sid key'
                auth_token = 'Auth token'
                client = Client(account_sid, auth_token)
 
                message = client.messages \
                                .create(
                                    body = takeCommand(),
                                    from_='Sender No',
                                    to ='Receiver No'
                                )
 
                print(message.sid)
 
        elif "wikipedia" in query:
            webbrowser.open("wikipedia.com")
 
        elif "Good Morning" in query:
            speak("A warm" +query)
            speak("How are you Mister")
            speak(assname)
 
        
        elif "will you be my gf" in query or "will you be my bf" in query:   
            speak("I'm not sure about, may be you should give me some time")
 
        elif "how are you" in query:
            speak("I'm fine, glad you me that")
 
        elif "i love you" in query:
            speak("It's hard to understand")
 
        elif "what is" in query or "who is" in query:
             
            
            
            client = wolframalpha.Client("API_ID")
            res = client.query(query)
             
            try:
                print (next(res.results).text)
                speak (next(res.results).text)
            except StopIteration:
                print ("No results")
 
        
            
            

Ausgabe: 
 

Zuhören… 
Erkennen… 
Benutzer sagte: Gaurav
####################### 
Willkommen Herr Gaurav 
################# #### 
Zuhören… 
Erkennen… 
Benutzer sagte: Ja
('Wie die Geschichtsschwerpunkte unter Ihnen heute nur allzu gut wissen, kann es den Anfang vom Ende markieren, wenn die Machthaber ihre eigenen Fakten erfinden und diejenigen angreifen, die sie in Frage stellen einer freien Gesellschaft. Das ist keine Übertreibung. Es ist das, was autoritäre Regime im Laufe der Geschichte getan haben. Sie versuchen, die Realität zu kontrollieren. Nicht nur unsere Gesetze und unsere Rechte und unsere Budgets, sondern auch unsere Gedanken und Überzeugungen. ',' Hillary Clinton ') 
Zuhören… 
Erkennen… 
Benutzer sagte: Gaurav in Wikipedia
Gaurav ist ein indischer und nepalesischer männlicher Name. Der Name bedeutet wörtlich Stolz.
== Bemerkenswerte Personen namens Gaurav == 
Gaurav S Bajaj, indischer Fernsehschauspieler 
Gaurav Bhatt, indischer Musikdirektor, Sänger, Songwriter. 
Hören… 
Erkennen… Der 
Benutzer sagte: Öffnen Sie YouTube
Hören… 
Erkennen…
Ihre Stimme kann nicht erkannt werden. 
Zuhören… 
Erkennen… 
Benutzer sagte: Beenden