Später Start, wie so oft Sonntags. Es gab einige neue Sachen, eine Art File Editing per diffs durch Gemini. Bei mehreren Dateien, ist das Editieren fehleranfällig. Man kann aber auch nicht immer die Komplettlösung verlangen.
Weiter schaute ich auf TTS Modelle, wo einige gut genug für meine Zwecke sein sollten. Kokoro kann man sicher lokal laufen lassen, Dia war aber besser, weil eben auch mit den gewünschten zwei Sprechern, die alles etwas weniger monoton machen sollten.
Auf den diff basierten Workflow über Powershell und Clipboard baute ich was. Noch nicht ausprobiert, wie auch die TTS DaVinci Resolve Lösung, die über Powershell aus der Lua Box rausgeht und im Filesystem meine Sprachschnippsel erstellen soll.
Es ging auch noch auf dem NUC der Libreautomate Server. Damit könnte ich lange Automations-Jobs Browser-Click Jobs auslagern. Das D: Drive ist da über LAN gemountet, womit alle Script ohne Anpassung laufen sollten. Mal sehen. Am liebsten wäre mir eine API-Browser Bridge, womit ich Gemini über Scripte nutzen kann und nicht die $15/Mio Token zahle.
Eine Spielerei war, dass ich ein 2MB JSON von eingestellten Startups mal analysieren ließ. Aus dem Website-Code ließ ich ein CSV bauen und dieses schließlich von Gemini analysieren. Was könnte man nochmal probieren, jetzt mit der technischen Entwicklung. Überraschende Ideen kamen nicht raus – alles was ich mir auch schon so dachte. Nur eben machen ist was anderes.
Joggen ging noch. Wenigstens etwas Sport. Eine Riesenportion Gulasch wurde mir freundlicherweiser serviert.
Wieder in alle Richtungen gelesen und probiert. Den Paper Muncher als eine Art HTML zu PDF engine, bekam ich unter WSL nicht kompiliert. Das Projekt sieht interessant für Dokumenten Modifikation aus.
Für etwas Produktivarbeit gingen noch eine Handvoll Videos in den nächtlichen Encode Job. Ich drehte überall die Farben auf, weil das die Leute wohl wollen. Alte Walks von 2022 in Maribor und Zadar waren nun endlich mal dran. Teilweise Ausschuss.
Dabei merkte ich: In Sachen Reisen und auch sonst hat sich die YouTube Situation seit 3 Jahren stets verschlechtert. Es sind eben auch zu viele Multicams auf Halde gefilmt worden und immer noch übrig. Mit Voiceovers bringt’s hoffentlich mehr als nur Cuts und Subs aber das muss eben gemacht werden. Erst jetzt wird die Technik dank LLMs, dem Mac mini und TTS Entwicklungen reif und bezahlbar.
0 Responses to “Diff-Fence”