Panda Dataframes aus HTML und zurück

Ich setzte mich endlich mal an die Pandas. Eine HTML Seite mit ’ner langen Tabelle wurde ordentlich geparsed, dann aber kam ich mit tabulate nicht weiter. Nur die erste Zeile/ der Header wurde angezeigt.

Endlich las ich „function read_html always returns a list of DataFrame objects“ und siehe da, alles ging danach – eben Erfahrungssache. Man konnte jetzt schön die Daten filtern und auch per HTML mit gescrapter Link wieder zurück ausgeben. Was würde ich ohne StackOverflow nur machen… Das sah dann nur alles nur unbrauchbar als Website aus.

Es folgten einige Stunden programmieren, wobei ich bis ca. 2:30 es dann hinbekam, wieder aus dem Panda Dataframe mit Ersetzen von Amazon Affiliate Links über Flask / Jijna eine HTML-Tabelle mit den richtigen class Attributen zu erzeugen. Nun folgt, das Ganze mit list.js sortierbar zu machen und dann mal zu releasen. Bilder-Popups wären auch noch nett, doch dazu muss ich mal alte Scraper rauskramen.

Endlich mal ein Tag mit ’nem Resultat. Das Dataframe + Jinja Zeug scheint gut. Am Ende wäre Hugo mit Data auch OK, weil der auch JSON und CSV lesen kann und re-renders aus dem Filesystem triggert. Erst mal ein normale Seite per cronjob und Shell Skripte öffentlich machen. Die Daten sind da, das Interface muss noch her.

0 Responses to “Panda Dataframes aus HTML und zurück”


Kommentare sind zur Zeit nicht möglich.