The Elder Scrolls 5: Skyrim Special Edition — je prenovitev rolne fantazijske igre z odprtim svetom The Elder Scrolls 5: Skyrim Legendary Edition... Več podrobnosti
xVASynth 2 - SKVA Synth.
xVASynth je orodje umetne inteligence za ustvarjanje visokokakovostnih govornih posnetkov z uporabo glasov iz video iger. Aplikacija podpira na stotine glasov v več desetinah iger in zagotavlja nadzor višine, trajanja in energije do potankosti.
Uvod
xVASynth (ali [SK]VASynth, za glasove Skyrim) je aplikacija umetne inteligence, ki ustvarja glasovne vrstice z uporabo določenih glasov iz video iger. Pretvori lahko besedilo v govor (TTS) iz vnosa besedila ali govor v govor (S2S) iz zvočnega vhoda. Aplikacija uporablja modele FastPitch [1,2], ki uporabnikom omogočajo umetniški nadzor nad višino, trajanjem in energijskimi vrednostmi (samo modeli v2+) za vsako črko v zvoku. Prav tako vam omogočajo ustvarjanje zvoka z eksplicitno izgovorjavo prek zapisa ARPAbet.
Uporaba živčne sinteze govora povzroči naravno zveneče glasove, kar je zelo težko doseči z bolj tradicionalnimi metodami, ki vključujejo združevanje obstoječih podatkov. To tudi pomeni, da je mogoče ustvariti nov besednjak, ki presega tisto, kar so glasovni igralci že prebrali.
xVASynth 2 — SKVA Synth.
xVASynth — это инструмент искусственного интеллекта для создания высококачественных реплик озвучки с использованием голосов из видеоигр. Приложение поддерживает сотни голосов в десятках игр и обеспечивает управление высотой тона, продолжительностью и энергией с точностью до каждой буквы.
Вступление
xVASynth (или [SK]VASynth, для голосов Skyrim) — это приложение с искусственным интеллектом, которое генерирует реплики озвучки, используя определенные голоса из видеоигр. Он может преобразовывать текст в речь (TTS) из текстового ввода или речь в речь (S2S) из аудиовхода. Приложение использует модели FastPitch [1,2], которые дают пользователям художественный контроль над высотой тона, длительностью и значениями энергии (только модели v2+) для каждой буквы в аудио. Они также позволяют генерировать звук с явно заданным произношением через нотацию ARPAbet.
Использование нейронного синтеза речи приводит к естественному звучанию голоса, что очень сложно сделать с помощью более традиционных методов, включающих объединение существующих данных. Это также означает, что может быть сгенерирован новый словарный запас помимо того, что актеры озвучивания уже прочитали.
Uporabne povezave: