Mittags wieder zum Folgetermin. Kleinere Schwierigkeiten, die sich in den kommenden Tagen klären müssen.
Zu Hause dann hatte ich bis Abends zu tun. Mein Bruder kam, brachte Gänsekeulen zum Fest für den Kühlschrank bis dahin.
Ich kam in der Nacht kurz zum Update meiner Sachen. Zuerst das recht neue „Sharp“ Modell von Apple, was ein einzelnes Photo in eine Gaussian Splatting Szene umwandelt. Einer auf Hacker News hatte einen kleinen Demo FastAPI Server mit MP4 Rendering gebaut, womit ich das testen konnte. War OK, leider aber kaum besser als das uralte 3D-Inpainting oder die schnellen Distorts per DepthMap.
Ein Export Plugin per Codex für Chrome von Kimi JSONs bekam ich nach einigen Schwierigkeit erst mit Gemini 3 hin. Etwas code in Sites zu injizieren braucht teils etwas kompliziertere Strategien.
TTS hatte ich fast wieder vergessen, die ganzen APIs wurden ja nie genutzt, womit das nach einem Monat wieder aus dem Kopf ist. Dazu installierte ich mich das chinesische CozyVoice. Codex baute es einige Linux Sachen auf Mac um. Insgesamt aber sehr chinesisch alles, das Gradio GUI recht unbenutzbarwobei auch Koreanisch, Japanisch und Englisch unterstützt wird. Die Qualität ist gut. Mal sehen, ob ich’s irgendwann doch mal nutze.
Nub.art schaute ich mir auch genauer an. Crowdpurr checkte ich auch. Hier kann man vielleicht doch was professionelleres aufziehen. Das Hauptproblem bleib bestehen, dass ich mich zu sehr verzettel. Die pano Site wäre als erstes fällig, doch vor den CSS Fixes habe ich Bammel. Zu viel zu tun und zu langwierig. Mal sehen, wie ich morgen wieder meine Token verpulver.
GUI Sachen stehen an, doch die gehen nur langsam mit LLMs.
0 Responses to “Sharp, CozyVoice”