Sprawdziłem te mody, i jeśli chodzi o Great Service oraz Idle Talk to nie powinno być większego problemu. Mercy - Combat AI Overhaul musiałbym dokładniej przeanalizować.
Byłbyś chętny pomóc przetłumaczyć kwestie dialogowe z tych modów na Polski do wygenerowania głosów i stworzenia polskich plików esp?
całkiem całkiem, jako tako ujdzie, ale są pewne problemy
liczby rzymskie są czytane jako litery
dziwny bełkot po prawie każdym zdaniu
czytanie tego co powinno nie być czytane np. Zabij jaskiniowe szczury (szczur jasikniowy)
pierwszy punkt zdaje się najłatwiejszy w naprawie, zastąp wszystkie "Uriel Septim VII" na "Uriel Septim Siódmy" jeśli tekst jest możliwy do otworzenia w notatniku to nawet Notepad ++ powinien móc automatycznie przeskanować teksty i dokonać zmian ogólnie tak 3/5 bo głosy dobre i widać potencjał
Wielkie dzięki za feedback! Zgoda, w Dubbingu jest wiele rzeczy które mogą ulec poprawie. Rzymska numeracja, postacie aktualnie nie czytają swoich imion, rang, klas i przynależnych frakcji. Morrowind to złożona bestia a założenie na początek było takie, żeby czytać jak najwięcej dialogów i spolszczyć Voices of Vvardenfell.
Niestety są też problemy których aktualnie nie bardzo mam jak naprawić. Tutaj odniosę się do tego bełkotu - Niestety takie artefakty występują w modelu XTTS-v2 szczególnie, jeżeli replikowany głos jest w innym języku. Jako próbki brałem oryginalne głosy z plików gry a one są po Angielsku. Może w kolejnej wersji będzie trochę lepiej
Całość też generowałem lokalnie na komputerze, żeby nie płacić kolosalnych sum za generowanie w chmurze . Dla kontekstu, cały mod generował się około 8 dni ciągłego obciążenia karty graficznej na 100%. Potem jeszcze re-generowałem 20% najgorzej wygenerowanych dialogów kolejne 3 razy wybierając najlepszą próbkę z 4 (oryginalna + 3 nowe). Więc łącznie całość generowała się jakieś 14 dni bez przerwy.
Jak będę miał możliwość to będą poprawki, natomiast dzięki temu projektowi zostałem poproszony przez ekipę Voxaltera o pomoc w ich wersji Dubbingu, a Voxalter ma dużo większe możliwości generowania lepszych głosów dzięki współpracy z Eleven Labs. Prace ciągle trwają więc polecam też śledzić stronę www.voxalter.io jeśli szukasz lepszej wersji tego projektu.
Chwilowo nie mam jeszcze dobrego rozwiązania na zmienne. Póki co w wersji 0.1 kazałem modelowi czytać to co jest w tekście tak jak jest w plikach gry. Niewątpliwie dobry pomysł na usprawnienie :)
9 comments
Byłbyś chętny pomóc przetłumaczyć kwestie dialogowe z tych modów na Polski do wygenerowania głosów i stworzenia polskich plików esp?
- liczby rzymskie są czytane jako litery
- dziwny bełkot po prawie każdym zdaniu
- czytanie tego co powinno nie być czytane np. Zabij jaskiniowe szczury (szczur jasikniowy)
pierwszy punkt zdaje się najłatwiejszy w naprawie, zastąp wszystkie "Uriel Septim VII" na "Uriel Septim Siódmy" jeśli tekst jest możliwy do otworzenia w notatniku to nawet Notepad ++ powinien móc automatycznie przeskanować teksty i dokonać zmianogólnie tak 3/5 bo głosy dobre i widać potencjał
Zgoda, w Dubbingu jest wiele rzeczy które mogą ulec poprawie. Rzymska numeracja, postacie aktualnie nie czytają swoich imion, rang, klas i przynależnych frakcji. Morrowind to złożona bestia a założenie na początek było takie, żeby czytać jak najwięcej dialogów i spolszczyć Voices of Vvardenfell.
Niestety są też problemy których aktualnie nie bardzo mam jak naprawić. Tutaj odniosę się do tego bełkotu - Niestety takie artefakty występują w modelu XTTS-v2 szczególnie, jeżeli replikowany głos jest w innym języku. Jako próbki brałem oryginalne głosy z plików gry a one są po Angielsku. Może w kolejnej wersji będzie trochę lepiej
Całość też generowałem lokalnie na komputerze, żeby nie płacić kolosalnych sum za generowanie w chmurze
Jak będę miał możliwość to będą poprawki, natomiast dzięki temu projektowi zostałem poproszony przez ekipę Voxaltera o pomoc w ich wersji Dubbingu, a Voxalter ma dużo większe możliwości generowania lepszych głosów dzięki współpracy z Eleven Labs. Prace ciągle trwają więc polecam też śledzić stronę www.voxalter.io jeśli szukasz lepszej wersji tego projektu.
Używam modelu tts_models/pl/mai_female/vits z projektu Coqui TTS.
Na razie to tylko lektor, ale docelowo nie wykluczam pełnego dubbingu AI.
Cały proces tworzenia jest opisany na GitHubie:
https://github.com/krupar101/morrowind_pl_ai_voice
btw. zaprosiłem na Discordzie.