HTML2MD

Ich trat etwas kürzer, weil mich einige Websachen aufregen. Mein Blog läuft wenigstens so schnell, wie selten zuvor. Ich schaute mir einige HTML -> MD oder Pug Projekte an. Alles relevant in Zusammenhang auch mit readability, flyscrape und dem soupault Workflow, den ich seit Jahren im Kopf habe

Mit dem neuen WordPress Kontakt mache ich da vielleicht doch mal wieder was.

Das Budapest Video war schließlich online – mit meinem Glucksen und leicht falschen Farben später. Zu wenige Zuschauer, um einen Neu-Renderaufwand zu betreiben und HDR dauert wohl auch noch eine Woche.

So spielte ich wieder mit Sunshine/Moonlight herum. Der Dell bekam die neues Sunshine Preview Version installiert. Auf dem HP testete ich somit mal AV1. Ganz stabile 60fps bekam ich irgendwie nicht hin. CPU und GPU hatten genug Spielraum aber es blieben immer nur um die 58fps, was einige Ruckler zeigte.

Später sollte ich einen dummy HDMI Plug nutzen, um dann Remote auf 1920×1080 auf dem Dell arbeiten zu können. Da brauche ich meine restlichen videos nicht mitnehmen, könnte mit den Proxies schneiden und auch mal außer Haus arbeiten. Selbst mit 5Mbit/s war die Qualität ausreichend. Schöne Technik.

Es gilt noch zu testen, wie der Performance-Verlust bei DaVinci Resolve Rendering wäre. Sunshine scheint schlau genug, die FPS bei wenig Bildschirm-Aktivität zu verringern.

Dann nochmal in den HTML zu Text Workflow:

Für die verschiedenen HTML Cleaner machte ich mal ein justfile zu Testen:
default:
@echo "Different commands for scraping from the CLI"
@echo "--------------------------------------------"
@just --list

strip-tags url:
curl -s "{{url}}" | strip-tags .content

trafilatura url:
trafilatura -u "{{url}}"

shot-scraper url:
shot-scraper javascript {{url}} "async () => { const readability = await import('https://cdn.skypack.dev/@mozilla/readability'); return (new readability.Readability(document)).parse(); }"

d2m url:
d2m -u "{{url}}"

Trafilatura zusammen mit readbility sollte gut kommen. Mal gucken ob man noch ein HTML Beautify hinterherjagt. Solche Sachen machten etwas Spaß.

Jetzt wieder mit WordPress und HTMX bissel hinbekommen, caching von Transients und dann auch DeDupe und LLM Unterstützung. Nebenbei sollte der Dell die restlichen HDR Videos rendern. Bis Ende des Monats kämen somit keine neuen Reisen in Betracht aber einen kleinen Urlaub brauche ich schon nochmal.

0 Responses to “HTML2MD”


  • Keine Kommentare

Antworten

You must be logged in to post a comment.