Zurück zu ZIM

Irrer Tagesablauf, weil ich den Hund noch früh versorgte, dann erst schlief. Er war die meiste Zeit ruhig, abends dann wieder aktiver. Es ist tagsüber noch immer schwül, sodass ich wieder erst Nachts etwas arbeitete.

Obwohl ich mit meiner Mediawiki Installation und der API zurechtkomme, ist durch die Verlinkung mit anderen Wikis und die Konvertierungsprobleme der Output der API nicht zu gebrauchen. Es gibt zu viele Warnungen und fehlende Seiten. Ich will noch immer nicht die kompletten Wikis einspielen, weil das erstens nicht so einfach scheint und zweites auch nicht alle Probleme lösen könnte, weil es eben sogar Interwiki Verbindungen gibt. Das wächst dann einfach zu groß.

Ich optimierte meine Funktionen etwas und werde wohl doch wieder die ZIM-HTMLs parsen. Per bs4 bekomme ich auch nodes raus und in den styles der Tabellen scheinen Infos zum Ursprungs Template zu stecken. Ich kann das vielleicht mit Regex oder dicts lösen und die Tabellen-Nodes eher da herausnehmen. Wenn das auch nicht klappt, bleibt nur die Verwurstung der ZIM-Daten, wie schon vor Tagen gedacht, als ganz normales HTML.

0 Responses to “Zurück zu ZIM”


Kommentare sind zur Zeit nicht möglich.
2018-08-04_17-56-11_IMG_20180804_175611.jpg
2018-08-04_17-56-11_IMG_20180804_175611.jpg
2018-08-04_17-56-22_IMG_20180804_175622.jpg
2018-08-04_17-56-22_IMG_20180804_175622.jpg
2018-08-04_19-35-31_IMG_20180804_193532.jpg
2018-08-04_19-35-31_IMG_20180804_193532.jpg
2018-08-04_19-36-05_IMG_20180804_193605.jpg
2018-08-04_19-36-05_IMG_20180804_193605.jpg