Windows, Drucker, SSD, Kiwix, libzim

Irre Hitze heute, kaum auszuhalten beim Schlafen. Schlechte Nachrichten aus Tajikistan, was bei mir auf der Reiseroute im September stand mit einem Anschlag auf Radfahrer. Ganz schöner Mist.

So ging’s schlecht gelaunt in den Tag. Ich bekam einen Anruf eines Kumpels aus Peking. Musste mal nach Passwort-Recovery unter Windows 10 googeln. Bei Windows 10 blieb es dann auch. Das April 2018 Update wurde irgendwie eingespielt. Ich räumte etwas im Keller um, damit der alte Brother Fax/Scanner/Drucker an den HP Laptop ging. Alle Kabel einen Meter zu kurz – schwitzen und schlechte Laune.

Das Update ging durch, ein HDMI->DVI Kabel fand ich auch noch. Damit kann der Laptop mit dem 24“ Monitor genutzt werden. Zwer Drucker sind dran doch das Update zeigte, dass es Zeit für SSD war. Eine CRUCIAL BX300 SSD, 480 GB SSD gab’s im Angebot für €69 von Mediamarkt. Vor einem halben Jahr zahlte ich für die Samsung 850 EVO noch ca. €135. Es war gar nicht so einfach, das Teil über ebay zu ergattern, weil viele Leute den Preis gut fanden. Ich bekam dann eine Bestellug nach 5 Mal probieren doch ausgeführt – auch mit 10% Rabatt Gutschein „POOL10“. Ja, der Pool ist ein anderes ungelöstes Problem – heute aber nicht.

Dank meiner erfolglosen und einfach zu aufwändigen Nachprogrammierung von MW-Templates, stieß ich auf Offline Wikipedia Reader Kiwix, die das ZIM Format nutzen. Mann! Wieso finde ich das erst jetzt? Da war alles zwar in HTML aber dafür ordentlich formatiert und ohne die ganzen Verrenkungen. Die Arbeit der letzten Wochen, den XML-Dump in Markdown zu konvertieren war damit fast umsonst. Ja, nur was gelernt. Es gibt auch von mehreren Seiten aktuelle Dumps in dem Format – wohl automatisiert. Das Alles geht wohl über lokale MW Installationen, die ich mir damit sparen kann.

Jetzt werde ich wohl doch HTML nehmen, bereinigen und schließlich per BeautifulSoup aufteilen. Ansonsten geht’s sicher mit eine Kombi aus XML und ZIM. Ganz schön dumm gelaufen aber am Ende zählt das Resultat. Hätte ich eben einfacher haben können aber erst mal beenden…nur ca. 600 Zeilen Code waren es ja bisher.

Spaghetti kochte ich dann auch – voll OK. Schwitzen bis Mitternacht.

Danach ging’s mal an’s compilieren und es wurde heftig. Zuerst mal war das ZIMply Projekt schon stark. Der Quellcode sieht schon anders aus, als mein Spaghetti Code. Es wird ein Webserver erzeugt, mit dem man auf die Artikel aus dem Archiv zugreifen kann. Dazu wird ein Reverse Index in SQLite noch gebaut. Es gibt auch ein Go Projekt, was das alles gut erledigt – auch mit Index. Die Frage ist, ob ich mein Interface dynamisch aus diesen Sachen generieren kann und sollte. Erst mal wollte ich aber Dumps haben und das gab’s Compile Probleme unter 10.10.

Auf dem MacAir mit 10.13 ging die kompiliering mit Meson und Ninja. Von den beiden Build-Systemen hatte ich vorher noch nie was gehört. Ein Haufen Dependecies per brew noch rein, Github Bug reports und Hilfe von anderen nachgelesen aber es ging auf 10.13 während auf 10.10 der Compiler ausstieg:
error: no viable overloaded '=' – whatever!

Ich machte den Dump der deutschen wikivoyage – ca. 25.000 Seiten, wofür das C++ zimdump Programm über 15 Minuten brauchte. Alle Dateien in einer Directory – wie gewollt, wenn auch ohne „.html“ und URL-fremde Dateinamen. Muss man das wirklich noch weiterverwursten – mit Python? Es kommen wieder Zweifel ob der Sinnhaftigkeit. Am Coolsten wäre die Sache zur Runtime mit den Regex, die ich schon habe. Vielleicht ein Proxy / Vagrant, der die gesäuberten Artikel dann zwischenspeichert?

Erst mal interessant, was es alles gibt. Dann war es um 4 und Zeit für Ende. Alles wieder in der Schwebe, wenn man mal tiefer geht. Dass, ich jetzt mit C++ Code rumhantiere, ist eher ein Rückschritt. Die compilierten Tools von 10.13 laufen nicht auf 10.10. Wäre ja auch zu einfach…

0 Responses to “Windows, Drucker, SSD, Kiwix, libzim”


Kommentare sind zur Zeit nicht möglich.
2018-07-31_15-18-01_IMG_20180731_151801.jpg
2018-07-31_15-18-01_IMG_20180731_151801.jpg
2018-07-31_17-09-09_IMG_20180731_170909_HDR.jpg
2018-07-31_17-09-09_IMG_20180731_170909_HDR.jpg
2018-08-01_04-20-43_IMG_20180801_042043.jpg
2018-08-01_04-20-43_IMG_20180801_042043.jpg
2018-08-01_05-53-43_P1250539.jpg
2018-08-01_05-53-43_P1250539.jpg