Dieses Notebook erzeugt Aussagen der Stimme Thorsten mit der coqui-Lib: https://github.com/coqui-ai/TTS
Thorstens Stimme: https://www.thorsten-voice.de
Allgemein:
Dieses Notebook läuft auf den Servern von Google, es verändert nichts auf Ihrem lokalen Rechner. Alle Eingaben werden Beendigung gelöscht.
Colab Notebooks enthalten Text- oder Codeblöcke. Codeblöcke werden durch SHIFT-ENTER ausgeführt (oder Play-Symbol oben links klicken).
Solange ein Block ausgeführt wird, wird nicht mehr die Nr [3] des Blocks, sondern ein Kreis angezeigt.
Sie können beliebig Daten verändern, das geschieht nur für Sie.
!pip install tts
!apt install espeak-ng
# gleiches Installationsprinzip, grundlegend andere Technik Torch
# Vorhandene Modelle anzeigen, String kopieren, um es zu nutzen
!tts --list_models
# Hilfe anzeigen
# !tts -h
# Test erstellen, dadurch wird das Modell in /root/.local/ gespeichert
!tts --text "Dies ist ein Test." --model_name "tts_models/de/thorsten/tacotron2-DCA"
import IPython.display as ipd
ipd.Audio('tts_output.wav')
# Lauf mit Griffin Lim Algo ohne Vocoder - metallisch
!tts --text "Die G T D ist die beste Konferenz der Welt." \
--model_path /root/.local/share/tts/tts_models--de--thorsten--tacotron2-DCA/model_file.pth \
--config_path /root/.local/share/tts/tts_models--de--thorsten--tacotron2-DCA/config.json \
--out_path metallisch.wav
# Audio anhören können
import IPython.display as ipd
ipd.Audio('metallisch.wav') # load a local WAV file
# Lauf mit Vocoder WaveGAN
!tts --text "Die G T D ist die beste Konferenz der Welt." --model_name "tts_models/de/thorsten/tacotron2-DCA"
ipd.Audio('tts_output.wav') # load a local WAV file
# Beispiel ohne Punkt
!tts --text "Die German Testing Days sind super." --model_name "tts_models/de/thorsten/vits"
ipd.Audio('tts_output.wav') # load a local WAV file
import requests
import IPython.display as ipd
# Define the Flask API URL
api_url = 'http://85.209.51.176:7777/tts' # Replace with the actual API URL
# Define the message to be sent
message = 'Guten Tag auf den German Testing Days'
import IPython.display as ipd
import base64
# Send a POST request to the API endpoint
response = requests.post(api_url, json={'message': message})
# Check if the request was successful
if response.status_code == 200:
# Retrieve the audio base64 string from the response
audio_base64 = response.json()['speech']
# Convert the base64 string to audio and play it
audio_data = base64.b64decode(audio_base64)
audio_element = ipd.Audio(data=audio_data, autoplay=True)
ipd.display(audio_element)
else:
print('Error:', response.json()['error'])