Erst der SF Mono mit Nerdfont installiert – ganz nett. Dann kam ein Musik-Copyright im Valencia Video. Dieses Mal überspielte ich sie mit einer anderen Musik, statt wegen einer Minute von über 2h nochmal alles hochzuladen.
Bis in den Abend hing ich weiter an TTS Tests. Ein GPT Plugin schien den Audio-Download Knopf zu blocken. In einem frischen Browser könnte man die Konvertierung dann schon automatisieren, nur ist das eben wackelig. Der Workflow von vorher und nochher Audio in’s Video ist noch nicht klar. Man muss ja schon genau das zeigen, was erzählt wird. Unklar ist, ob man das Video oder Audio schneller ändert.
Ich testete im OpenAI Playground mal die API Sprache Ausgabe. Die ‚Sol‘ Stimme gibt’s da gar nicht aber ‚Nova‘ war auch akzeptabel, besonders in HQ mit mehr Emotion. Sage hatte zu viel Exitement, Shimmer zu wenig. Das macht dann eben um die €2 pro Video aber das könnte sich dennoch lohnen. Man muss das Arrangieren auch per Timestamps erledigen, die Texte wirklich dem Video anpassen und vielleicht mal fix über eigenes TTS testen. Vielleicht doch alles in Ableton mit DaVinci danach? Es wird viel Arbeit aber die Qualität zählt hier eben mehr, als die Masse, die jetzt mit den 1-2K Views pro Video einfach am Ende ist. Man könnte die ganzen Videos auch kürzen, was billiger wäre. Man könnte vieles…macht eben auch alles viel Arbeit bei unklaren Erfolgschancen.
Ich ging heute mal in die andere Richtung joggen und sah beim Sonnenuntergang mal was Neues. Viele Wohnhäuser in schöner Umgebung. Der Untergrund auch nur Bentonplatten.
Auf meinen Selfies sah ich den Bauchansatz stärker als sonst. Mit ein paar Joggings ist’s eben nicht getan, wenn man so viel Kalorien sonst konsumiert. Etwas demotiviert trottete ich zurück. Mehr Sport aber zu Hause ist es trist auf meiner Runde, in einem Fitness-Studio auf der Stelle noch sinnloser.
Meine Wäsche stellte ich noch an, saß dann wieder am Laptop und holte sie später ab. Der Manager fragte an der Tür, ob er schon die Rechnung geschrieben habe – nein. Ich solle nochmal die Adresse schicken aber naja.
Auch etwas anderes Abendessen aus der Dose mit Kichererbsen. Dann die Subs für Marmaris. Hier gibt es auch noch Probleme. Es wird nicht automatisch erkannt, wenn die Talking points und Antworten nicht zueinander passen. Somit musste ich die Übersetzung wieder 2 Mal bezahlen. Wenn es so übersparsam weiter geht, sehe ich wenig Hoffnung. Die Prompts müssen auch irgendwie cooler werden. Bei TTS sind mir die Pausen zwischen den Sätzen zu kurz. So schnell holt niemand Luft. Per [pause] schien sich manchmal was zu verbessern. Kann aber Plazebo sein.
Als ich dann die Marmaris Subs und Descs hochladen wollte, sah ich das neue Interface für die Languages. Das Autodubbing per AI ist jetzt richtig in YouTube Studio integriert. Manuelle Subs kann man noch hochladen, nur ist alles anders und ich muss meine Scripte anpassen. Auch hier, könnte ich eher auf die API setzen, denn mehr als einen Sub pro Tag schaffte ich bisher ja auch nicht.
Wanne, Sangria und viel lesen der Nachrichten. Alles nichts neues und wieder im alten Trott. Der Kiefer wackelt und knirscht, nicht verbessert sich. Nur mehr Sachen werden möglich.
Trotzdem interessant, wie sich alle Sachen so in die Richtung bewegen, die mich auch interessiert. Die Tage mit TTS beschäftigt, gestern das erste Dub Video von Spanisch auf Englisch und heute auch selbst im Interface gesehen. Wer schneidet mir nur die ganzen Videos zusammen… Piper sollte ich bald mal installieren und als pre-audio nutzen, bevor OpeAI Credits verbraten werden.
0 Responses to “AI Dubs”