xVASynth 2 - SKVA Synth - orodje za glasovni prenos

  • Elder Scrolls 5: Skyrim Special Edition — xVASynth 2 - SKVA Synth - orodje za glasovni prenos
  • Elder Scrolls 5: Skyrim Special Edition — xVASynth 2 - SKVA Synth - orodje za glasovni prenos
Avtor: Dan Ruta
Velikost: 723.20 MB
Dodano: Flixx
Datum: 26 april 2022, 10:21
Prenosov: 1136

xVASynth 2 - SKVA Synth.

xVASynth je orodje umetne inteligence za ustvarjanje visokokakovostnih govornih posnetkov z uporabo glasov iz video iger. Aplikacija podpira na stotine glasov v več desetinah iger in zagotavlja nadzor višine, trajanja in energije do potankosti.

Uvod

xVASynth (ali [SK]VASynth, za glasove Skyrim) je aplikacija umetne inteligence, ki ustvarja glasovne vrstice z uporabo določenih glasov iz video iger. Pretvori lahko besedilo v govor (TTS) iz vnosa besedila ali govor v govor (S2S) iz zvočnega vhoda. Aplikacija uporablja modele FastPitch [1,2], ki uporabnikom omogočajo umetniški nadzor nad višino, trajanjem in energijskimi vrednostmi (samo modeli v2+) za vsako črko v zvoku. Prav tako vam omogočajo ustvarjanje zvoka z eksplicitno izgovorjavo prek zapisa ARPAbet.

Uporaba živčne sinteze govora povzroči naravno zveneče glasove, kar je zelo težko doseči z bolj tradicionalnimi metodami, ki vključujejo združevanje obstoječih podatkov. To tudi pomeni, da je mogoče ustvariti nov besednjak, ki presega tisto, kar so glasovni igralci že prebrali.

Ime in opis datoteke sta bila prevedena. Pokaži izvirnik (RU)Prikaži prevod (SL)
xVASynth 2 - SKVA Synth - инструмент для озвучки

xVASynth 2 — SKVA Synth.

xVASynth — это инструмент искусственного интеллекта для создания высококачественных реплик озвучки с использованием голосов из видеоигр. Приложение поддерживает сотни голосов в десятках игр и обеспечивает управление высотой тона, продолжительностью и энергией с точностью до каждой буквы.

Вступление

xVASynth (или [SK]VASynth, для голосов Skyrim) — это приложение с искусственным интеллектом, которое генерирует реплики озвучки, используя определенные голоса из видеоигр. Он может преобразовывать текст в речь (TTS) из текстового ввода или речь в речь (S2S) из аудиовхода. Приложение использует модели FastPitch [1,2], которые дают пользователям художественный контроль над высотой тона, длительностью и значениями энергии (только модели v2+) для каждой буквы в аудио. Они также позволяют генерировать звук с явно заданным произношением через нотацию ARPAbet.

Использование нейронного синтеза речи приводит к естественному звучанию голоса, что очень сложно сделать с помощью более традиционных методов, включающих объединение существующих данных. Это также означает, что может быть сгенерирован новый словарный запас помимо того, что актеры озвучивания уже прочитали.

Uporabne povezave:

Komentarji 0