Vibe Scrape

Relativ ruhiger Tag. Es wäre vielleicht wieder zu einer Aktion gekommen, wie letzte Woche gekommen, doch man muss wohl erst mal abwarten.

Trotz nur kurzer Nacht, hielt ich lange durch. Ich setzte ich erneut mit Opus 4.5 an den Deal Aggregator. Mit ca. 700 Deals pro Tag ist das Volumen doch ordentlich. Per Miniflux API zog ich die Artikel runter und scrapte dann den echten Deal Button für den linktrace. Dabei wurde die linktrace Lib direkt im Projekt verwurstet, was alles beschleunigte. Ein Monolith ist doch schneller zu debuggen.

Jedenfalls war ich ordentlich dabei und verpulverte die AI Pro Token schnell. Damit sah ich zum ersten Mal das wöchentliche Kontingent erschöpft. Nur noch 40% bis in 5 1/2 Tagen. Das war doch enttäuschend, denn Gemini Flash ist nur schnell, Pro Low hing öfters fest und Pro High war einfach zu langsam. Dennoch kam ich zu einem brauchbaren Ergebnis der Pipeline: RSS Ingest -> Link Scrape und Trace -> Mistral Summarize.

Bei ministral8b zahlt man um die €0.15/MTok. Noch biliger wäre es über Openrouter oder nanoGPT aber ich habe eben dummerweise die €10 bei Mistral einzahlen müssen. Daher ließ ich auch einen Batch Modus implementieren, was etwas Kohle sparen sollte. Leider unterstüztzt any-llm Batch nur für ein paar Anbieter – Mistral noch nicht. Die Dep muss somit wieder weg. Wieauchimmer. Es war cool, die RSS zu Post Rewrite Schiene ausreichend gut unter Kontrolle zu haben. Stabilisierung per absurd wäre dann später wichtig und eben Redundanz über mind. einen Handy Scraper für residential IPs.

Ich probierte sogar mal eine Markoff Chain aus den 30K Deal Texten aber da kam nur Mist raus. LLMs sind für rewrites erst mal billig genug. Die ganzen Tests heute kosteten gerade mal einen Cent.

Ich kam erst kurz vor 22:00 zu einer kleinen Jogging-Runde. War wichtig und schön, bei dem Mond mit schnebedeckten Wegen.

Mitternacht dann doch fertig. Noch ein paar Veo Tests und schließlich gegen 2 dann erst in die Heija.

0 Responses to “Vibe Scrape”


  • Keine Kommentare

Antworten

You must be logged in to post a comment.