Sprachassistent mit Python
Wie wir wissen, ist Python eine geeignete Sprache für Drehbuchautoren und Entwickler. Schreiben wir ein Skript für Voice Assistant mit Python. Die Abfrage für den Assistenten kann je nach Bedarf des Benutzers bearbeitet werden.
Bei der Spracherkennung wird Audio in Text umgewandelt. Dies wird häufig in Sprachassistenten wie Alexa, Siri usw. verwendet. Python bietet eine API namens SpeechRecognition , mit der wir Audio zur weiteren Verarbeitung in Text konvertieren können. In diesem Artikel werden wir uns mit der Konvertierung großer oder langer Audiodateien in Text mithilfe der SpeechRecognition-API in Python befassen.
Module benötigt
- Unterprozess: - Dieses Modul wird zum Abrufen von Systemunterprozessdetails verwendet, die in verschiedenen Befehlen verwendet werden, z. B. Herunterfahren, Ruhezustand usw. Dieses Modul ist in Python integriert.
- Wolframalpha: - Es wird verwendet, um Antworten auf Expertenebene unter Verwendung der Wolfram-Algorithmen, der Wissensdatenbank und der KI-Technologie zu berechnen. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
pip installieren wolframaplha
- Pyttsx3: - Dieses Modul wird zur Konvertierung von Text in Sprache in einem Programm verwendet, das offline funktioniert. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
pip install pyttsx3
- Tkinter: - Dieses Modul wird zum Erstellen der GUI verwendet und wird mit Python geliefert. Dieses Modul ist in Python integriert.
- Wikipedia: - Wie wir alle wissen, ist Wikipedia genau wie GeeksforGeeks eine großartige Wissensquelle. Wir haben das Wikipedia-Modul verwendet, um Informationen von Wikipedia abzurufen oder eine Wikipedia-Suche durchzuführen. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
pip install wikipedia
- Spracherkennung: - Da wir eine Anwendung des Sprachassistenten erstellen, ist eines der wichtigsten Dinge dabei, dass Ihr Assistent Ihre Stimme erkennt (dh was Sie sagen / fragen möchten). Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
pip install SpeechRecognition
- Webbrowser: - So führen Sie eine Websuche durch. Dieses Modul ist in Python integriert.
- Ecapture: - Zum Aufnehmen von Bildern von Ihrer Kamera. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
pip install ecapture
- Pyjokes: - Pyjokes wird zum Sammeln von Python-Witzen über das Internet verwendet. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
Pip installieren Pyjokes
- Datum / Uhrzeit: - Datum und Uhrzeit werden verwendet, um Datum und Uhrzeit anzuzeigen . Dieses Modul ist in Python integriert.
- Twilio: - Twilio wird zum Tätigen von Anrufen und Nachrichten verwendet. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
pip install twilio
- Anfragen: Anfragen werden zum Erstellen von GET- und POST-Anfragen verwendet. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
Pip Installationsanforderungen
- BeautifulSoup: Beautiful Soup ist eine Bibliothek, mit der Informationen einfach von Webseiten entfernt werden können. Um dieses Modul zu installieren, geben Sie den folgenden Befehl in das Terminal ein.
pip install beautifulsoup4
Hinweis: Sie können einen Teil der Importdatei entfernen, wenn Sie diese Funktion nicht erhalten möchten, wie hier beschrieben. Twilio zum Tätigen von Anrufen und Nachrichten. Wenn Sie diese Funktion nicht verwenden möchten, können Sie diese Funktion einfach entfernen.
Implementierung
Importieren Sie die folgenden Bibliotheken.
import
subprocess
import
wolframalpha
import
pyttsx3
import
tkinter
import
json
import
random
import
operator
import
speech_recognition as sr
import
datetime
import
wikipedia
import
webbrowser
import
os
import
winshell
import
pyjokes
import
feedparser
import
smtplib
import
ctypes
import
time
import
requests
import
shutil
from
twilio.rest
import
Client
from
clint.textui
import
progress
from
ecapture
import
ecapture as ec
from
bs4
import
BeautifulSoup
import
win32com.client as wincl
from
urllib.request
import
urlopen
Jetzt setzen wir unsere Engine auf Pyttsx3, das für Text-to-Speech in Python verwendet wird, und sapi5 ist die Microsoft-Plattform für Sprachanwendungsplattformen, die wir für die Text-to-Speech-Funktion verwenden werden.
engine
=
pyttsx3.init(
'sapi5'
)
voices
=
engine.getProperty(
'voices'
)
engine.setProperty(
'voice'
, voices[
1
].
id
)
Sie können die Sprach-ID für männliche Stimme auf „0“ ändern, während Sie den Assistenten verwenden. Hier verwenden wir weibliche Stimme für den gesamten Text in Sprache
def
speak(audio):
engine.say(audio)
engine.runAndWait()
def
wishMe():
hour
=
int
(datetime.datetime.now().hour)
if
hour>
=
0
and
hour<
12
:
speak(
"Good Morning Sir !"
)
elif
hour>
=
12
and
hour<
18
:
speak(
"Good Afternoon Sir !"
)
else
:
speak(
"Good Evening Sir !"
)
assname
=
(
"Jarvis 1 point o"
)
speak(
"I am your Assistant"
)
speak(assname)
def
usrname():
speak(
"What should i call you sir"
)
uname
=
takeCommand()
speak(
"Welcome Mister"
)
speak(uname)
columns
=
shutil.get_terminal_size().columns
(
"#####################"
.center(columns))
(
"Welcome Mr."
, uname.center(columns))
(
"#####################"
.center(columns))
speak(
"How can i Help you, Sir"
)
def
takeCommand():
r
=
sr.Recognizer()
with sr.Microphone() as source:
(
"Listening..."
)
r.pause_threshold
=
1
audio
=
r.listen(source)
try
:
(
"Recognizing..."
)
query
=
r.recognize_google(audio, language
=
'en-in'
)
(f
"User said: {query}\n"
)
except
Exception as e:
(e)
(
"Unable to Recognize your voice."
)
return
"None"
return
query
def
sendEmail(to, content):
server
=
smtplib.SMTP(
'smtp.gmail.com'
,
587
)
server.ehlo()
server.starttls()
server.login(
'your email id'
,
'your email passowrd'
)
server.sendmail(
'your email id'
, to, content)
server.close()
Die Hauptfunktion beginnt hier, wir werden jetzt alle diese Funktionen in der Hauptfunktion aufrufen.
if
__name__
=
=
'__main__'
:
clear
=
lambda
: os.system(
'cls'
)
clear()
wishMe()
usrname()
while
True
:
query
=
takeCommand().lower()
if
'wikipedia'
in
query:
speak(
'Searching Wikipedia...'
)
query
=
query.replace(
"wikipedia"
, "")
results
=
wikipedia.summary(query, sentences
=
3
)
speak(
"According to Wikipedia"
)
(results)
speak(results)
elif
'open youtube'
in
query:
speak(
"Here you go to Youtube\n"
)
webbrowser.
open
(
"youtube.com"
)
elif
'open google'
in
query:
speak(
"Here you go to Google\n"
)
webbrowser.
open
(
"google.com"
)
elif
'open stackoverflow'
in
query:
speak(
"Here you go to Stack Over flow.Happy coding"
)
webbrowser.
open
(
"stackoverflow.com"
)
elif
'play music'
in
query
or
"play song"
in
query:
speak(
"Here you go with music"
)
music_dir
=
"C:\\Users\\GAURAV\\Music"
songs
=
os.listdir(music_dir)
(songs)
random
=
os.startfile(os.path.join(music_dir, songs[
1
]))
elif
'the time'
in
query:
strTime
=
datetime.datetime.now().strftime(
"% H:% M:% S"
)
speak(f
"Sir, the time is {strTime}"
)
elif
'open opera'
in
query:
codePath
=
r
"C:\\Users\\GAURAV\\AppData\\Local\\Programs\\Opera\\launcher.exe"
os.startfile(codePath)
elif
'email to gaurav'
in
query:
try
:
speak(
"What should I say?"
)
content
=
takeCommand()
to
=
"Receiver email address"
sendEmail(to, content)
speak(
"Email has been sent !"
)
except
Exception as e:
(e)
speak(
"I am not able to send this email"
)
elif
'send a mail'
in
query:
try
:
speak(
"What should I say?"
)
content
=
takeCommand()
speak(
"whome should i send"
)
to
=
input
()
sendEmail(to, content)
speak(
"Email has been sent !"
)
except
Exception as e:
(e)
speak(
"I am not able to send this email"
)
elif
'how are you'
in
query:
speak(
"I am fine, Thank you"
)
speak(
"How are you, Sir"
)
elif
'fine'
in
query
or
"good"
in
query:
speak(
"It's good to know that your fine"
)
elif
"change my name to"
in
query:
query
=
query.replace(
"change my name to"
, "")
assname
=
query
elif
"change name"
in
query:
speak(
"What would you like to call me, Sir "
)
assname
=
takeCommand()
speak(
"Thanks for naming me"
)
elif
"what's your name"
in
query
or
"What is your name"
in
query:
speak(
"My friends call me"
)
speak(assname)
(
"My friends call me"
, assname)
elif
'exit'
in
query:
speak(
"Thanks for giving me your time"
)
exit()
elif
"who made you"
in
query
or
"who created you"
in
query:
speak(
"I have been created by Gaurav."
)
elif
'joke'
in
query:
speak(pyjokes.get_joke())
elif
"calculate"
in
query:
app_id
=
"Wolframalpha api id"
client
=
wolframalpha.Client(app_id)
indx
=
query.lower().split().index(
'calculate'
)
query
=
query.split()[indx
+
1
:]
res
=
client.query(
' '
.join(query))
answer
=
next
(res.results).text
(
"The answer is "
+
answer)
speak(
"The answer is "
+
answer)
elif
'search'
in
query
or
'play'
in
query:
query
=
query.replace(
"search"
, "")
query
=
query.replace(
"play"
, "")
webbrowser.
open
(query)
elif
"who i am"
in
query:
speak(
"If you talk then definately your human."
)
elif
"why you came to world"
in
query:
speak(
"Thanks to Gaurav. further It's a secret"
)
elif
'power point presentation'
in
query:
speak(
"opening Power Point presentation"
)
power
=
r
"C:\\Users\\GAURAV\\Desktop\\Minor Project\\Presentation\\Voice Assistant.pptx"
os.startfile(power)
elif
'is love'
in
query:
speak(
"It is 7th sense that destroy all other senses"
)
elif
"who are you"
in
query:
speak(
"I am your virtual assistant created by Gaurav"
)
elif
'reason for you'
in
query:
speak(
"I was created as a Minor project by Mister Gaurav "
)
elif
'change background'
in
query:
ctypes.windll.user32.SystemParametersInfoW(
20
,
0
,
"Location of wallpaper"
,
0
)
speak(
"Background changed succesfully"
)
elif
'open bluestack'
in
query:
appli
=
r
"C:\\ProgramData\\BlueStacks\\Client\\Bluestacks.exe"
os.startfile(appli)
elif
'news'
in
query:
try
:
jsonObj
=
urlopen(
)
data
=
json.load(jsonObj)
i
=
1
speak(
'here are some top news from the times of india'
)
(
+
'\n')
for
item
in
data[
'articles'
]:
(
str
(i)
+
'. '
+
item[
'title'
]
+
'\n'
)
(item[
'description'
]
+
'\n'
)
speak(
str
(i)
+
'. '
+
item[
'title'
]
+
'\n'
)
i
+
=
1
except
Exception as e:
(
str
(e))
elif
'lock window'
in
query:
speak(
"locking the device"
)
ctypes.windll.user32.LockWorkStation()
elif
'shutdown system'
in
query:
speak(
"Hold On a Sec ! Your system is on its way to shut down"
)
subprocess.call(
'shutdown / p /f'
)
elif
'empty recycle bin'
in
query:
winshell.recycle_bin().empty(confirm
=
False
, show_progress
=
False
, sound
=
True
)
speak(
"Recycle Bin Recycled"
)
elif
"don't listen"
in
query
or
"stop listening"
in
query:
speak(
"for how much time you want to stop jarvis from listening commands"
)
a
=
int
(takeCommand())
time.sleep(a)
(a)
elif
"where is"
in
query:
query
=
query.replace(
"where is"
, "")
location
=
query
speak(
"User asked to Locate"
)
speak(location)
webbrowser.
open
(
"https://www.google.nl / maps / place/"
+
location
+
"")
elif
"camera"
in
query
or
"take a photo"
in
query:
ec.capture(
0
,
"Jarvis Camera "
,
"img.jpg"
)
elif
"restart"
in
query:
subprocess.call([
"shutdown"
,
"/r"
])
elif
"hibernate"
in
query
or
"sleep"
in
query:
speak(
"Hibernating"
)
subprocess.call(
"shutdown / h"
)
elif
"log off"
in
query
or
"sign out"
in
query:
speak(
"Make sure all the application are closed before sign-out"
)
time.sleep(
5
)
subprocess.call([
"shutdown"
,
"/l"
])
elif
"write a note"
in
query:
speak(
"What should i write, sir"
)
note
=
takeCommand()
file
=
open
(
'jarvis.txt'
,
'w'
)
speak(
"Sir, Should i include date and time"
)
snfm
=
takeCommand()
if
'yes'
in
snfm
or
'sure'
in
snfm:
strTime
=
datetime.datetime.now().strftime(
"% H:% M:% S"
)
file
.write(strTime)
file
.write(
" :- "
)
file
.write(note)
else
:
file
.write(note)
elif
"show note"
in
query:
speak(
"Showing Notes"
)
file
=
open
(
"jarvis.txt"
,
"r"
)
(
file
.read())
speak(
file
.read(
6
))
elif
"update assistant"
in
query:
speak(
"After downloading file please replace this file with the downloaded one"
)
url
=
'# url after uploading file'
r
=
requests.get(url, stream
=
True
)
with
open
(
"Voice.py"
,
"wb"
) as Pypdf:
total_length
=
int
(r.headers.get(
'content-length'
))
for
ch
in
progress.bar(r.iter_content(chunk_size
=
2391975
),
expected_size
=
(total_length
/
1024
)
+
1
):
if
ch:
Pypdf.write(ch)
elif
"jarvis"
in
query:
wishMe()
speak(
"Jarvis 1 point o in your service Mister"
)
speak(assname)
elif
"weather"
in
query:
api_key
=
"Api key"
base_url
=
"http://api.openweathermap.org / data / 2.5 / weather?"
speak(
" City name "
)
(
"City name : "
)
city_name
=
takeCommand()
complete_url
=
base_url
+
"appid ="
+
api_key
+
"&q ="
+
city_name
response
=
requests.get(complete_url)
x
=
response.json()
if
x[
"cod"
] !
=
"404"
:
y
=
x[
"main"
]
current_temperature
=
y[
"temp"
]
current_pressure
=
y[
"pressure"
]
current_humidiy
=
y[
"humidity"
]
z
=
x[
"weather"
]
weather_description
=
z[
0
][
"description"
]
(
" Temperature (in kelvin unit) = "
+
str
(current_temperature)
+
"\n atmospheric pressure (in hPa unit) ="
+
str
(current_pressure)
+
"\n humidity (in percentage) = "
+
str
(current_humidiy)
+
"\n description = "
+
str
(weather_description))
else
:
speak(
" City Not Found "
)
elif
"send message "
in
query:
account_sid
=
'Account Sid key'
auth_token
=
'Auth token'
client
=
Client(account_sid, auth_token)
message
=
client.messages \
.create(
body
=
takeCommand(),
from_
=
'Sender No'
,
to
=
'Receiver No'
)
(message.sid)
elif
"wikipedia"
in
query:
webbrowser.
open
(
"wikipedia.com"
)
elif
"Good Morning"
in
query:
speak(
"A warm"
+
query)
speak(
"How are you Mister"
)
speak(assname)
elif
"will you be my gf"
in
query
or
"will you be my bf"
in
query:
speak(
"I'm not sure about, may be you should give me some time"
)
elif
"how are you"
in
query:
speak(
"I'm fine, glad you me that"
)
elif
"i love you"
in
query:
speak(
"It's hard to understand"
)
elif
"what is"
in
query
or
"who is"
in
query:
client
=
wolframalpha.Client(
"API_ID"
)
res
=
client.query(query)
try
:
(
next
(res.results).text)
speak (
next
(res.results).text)
except
StopIteration:
(
"No results"
)
Ausgabe:
Zuhören…
Erkennen…
Benutzer sagte: Gaurav
#######################
Willkommen Herr Gaurav
################# ####
Zuhören…
Erkennen…
Benutzer sagte: Ja
('Wie die Geschichtsschwerpunkte unter Ihnen heute nur allzu gut wissen, kann es den Anfang vom Ende markieren, wenn die Machthaber ihre eigenen Fakten erfinden und diejenigen angreifen, die sie in Frage stellen einer freien Gesellschaft. Das ist keine Übertreibung. Es ist das, was autoritäre Regime im Laufe der Geschichte getan haben. Sie versuchen, die Realität zu kontrollieren. Nicht nur unsere Gesetze und unsere Rechte und unsere Budgets, sondern auch unsere Gedanken und Überzeugungen. ',' Hillary Clinton ')
Zuhören…
Erkennen…
Benutzer sagte: Gaurav in Wikipedia
Gaurav ist ein indischer und nepalesischer männlicher Name. Der Name bedeutet wörtlich Stolz.
== Bemerkenswerte Personen namens Gaurav ==
Gaurav S Bajaj, indischer Fernsehschauspieler
Gaurav Bhatt, indischer Musikdirektor, Sänger, Songwriter.
Hören…
Erkennen… Der
Benutzer sagte: Öffnen Sie YouTube
Hören…
Erkennen…
Ihre Stimme kann nicht erkannt werden.
Zuhören…
Erkennen…
Benutzer sagte: Beenden