VR

Ich bastelte etwas am Theme und musste gleich mal die Variablen besser benennen. Die WordPress Post Ids landen wneigstens jetzt auch wieder in der DB. Ein Kumpel kam nachmittags. Lange nicht gesehen und ich sah nun das erste mal auch das Gear VR von Samsung.

Die Auflösung kann nicht groß genug sein, wenn man den Screen so nah vor der Pupille hat. Schon cool, was da geht aber es muss da auch noch weiter gehen. Als neue Erfahrung mit Full 3D und Headtracking ist es schon was Tolles. Mehr FPS, mehr Auflösung usw..

Weiter am Theme nach 18:00. Ich änderte einen Art im responsive Design auf zweispaltig. Dann später mit dem Auto in die Stadt zur Abholung.

Warm ist’s heute. Eine Pizza draußen und etwas deideln. Ich mache die ganze Schnäppchen-Geschichte als eine Art Suchmaschine. Damit umgehe ich eventuelle Content-Probleme, weil ja auch Google die Texte übernimmt. Erst wollte ich die Domains von http.net übertragen, sah nun jedoch, dass das Admin Interface ganz brauchbar ist und die Preise teilweise unter den Konsumer-Anbietern sind. Bleibe also auch bei denen, wo halt die gamesnap.de URL läuft.

Für Selenium gibt’s auch Python Bindungs. Ich werde das später nochmal checken, denn die jetzige „Lösung“ mit dem Ruby Shell Aufruf ist instabil und einfach zu hackig. Da muss es einen besseren Weg geben.

Am Ende aber Bisse und Probleme wohl mit ungewollten Neuankömmlingen. Ich erwischte ein Tierchen. Zur Vorsicht verfrachtete ich alles in den Keller.

Ich schaffte es am Ende noch, die datetime für die Posts zu setzen. Somit sind auch mit dem sequentiellen Feedfetching die Posts in der richtigen Reihenfolge. Man sieht die ganzen Dupes und das sollte wohl auch der nächste Schritt sein – ein Deduper. Mal sehen, wie das gehen soll. Pro Tag kommen fast 200 Posts zusammen. Es muss also dann wirklich auch sortiert werden aber die Unterseite für Games kann und sollte ich schneller launchen. Wenn das Ding erst mal läuft, hört die Arbeit ja nicht auf. Es muss dann ständig verbessert werden.

In der Loop sollten nach den Top Posts dann alle anderen nur mit Title und danach nur mit Bild+Extra angezeigt werden. Ein Bildcache per Google sollte auch in Extremfällen noch her. Viele viele Ideen, wie man das System erweitert aber alles eins nach dem anderen.

Heute war ich nicht sonderlich produktiv, zwei kleine Erweiterungen nur. Bei der Sortierung nach Tagen dann sollte ich nicht „2d“ als vorgestern nehmen sonder „Vorgestern 12:34“ also mit Uhrzeit. Am heutigen Tag – also bis 24h reicht’s auch ohne Uhrzeit. Mit gestern / heute als Seiten-switches umgehe ich das Problem mit „Vorherige Seite“ / „Nächste Seite“ wo man nie genau weiß, ob man nun in die Vergangenheit oder Zukunft clickt.

Für die Dupes eignet sich wohl besser ein SQL Query in etwa SELECT * WHERE is_duplicate_of = post_id. Die ganze Sache muss nur echt gecacht werden, wenn die Abfrage für jede Post kommt oder sollte ich dann gleich die Post updaten? Mal sehen, was mit dem Jaccard Index geht.

Mit dem angepassten Skript machte ich mal einen Check auf dem lokalen Blog. Affengeil! Es wurden viele Dupes gefunden – 3 bis 4 bei größeren Artikeln. Allerdings gab’s auch einige Falschmeldungen wie „Tommy Hilfiger mit bis zu 70% Rabatt bei Zalando, Nike Sale mit bis zu 70% Rabatt bei Zalando“. Ich werde da mal versuchen die 70%, die ich ja schon per Regex grabbe, also die ganzen Extras aus dem Text zu entfernen und dann das Ding nochmal zu checken. Es ist hiermit auch klar, dass die ganzen Schnäppchenblogs aus Textbausteinen bestehen – vielleicht sogar mit Textexpander geschrieben werden. Die Wiederholungen „mit bis zu“, „für“, „Final Sale“ und „Rabatt“ müssen raus, weil die in fast allen Titeln auftauchen und Gewichtung von den Marken wegnehmen. Den Text massiere ich mir schon etwas für weniger false positives.

Billiger Content halt aber meiner wird hoffentlich noch billiger, wenn ich die Textbausteine auf meine Version spinne. Noch macht’s Spaß, auch wenn der schwierigste Teil mit den eigenen Aff-Links noch kommt. Ich lasse das erst mal sein und linke auf die Originale. Die Checks auf neue Posts, ob nun gepostet oder Dupe sollten schnell gehen bei nur einem Tag. Für alle bisherigen 20 WordPress Seiten mit insgesamt 589 Posts brauchte mein mac 16 sek. …und das über HTTP Zugriff. Direkt über SQLLite sollte das dann ratzfatz gehen. Irre cool. Schluss um 3.

0 Responses to “VR”


Kommentare sind zur Zeit nicht möglich.
2015-08-07_12-19-25_2015-08-07-12.19.25.jpg
2015-08-07_12-19-25_2015-08-07-12.19.25.jpg
2015-08-07_18-57-24_2015-08-07-18.57.24.jpg
2015-08-07_18-57-24_2015-08-07-18.57.24.jpg
2015-08-07_18-58-11_2015-08-07-18.58.11.jpg
2015-08-07_18-58-11_2015-08-07-18.58.11.jpg
2015-08-07_19-54-51_DSCF1749.jpg
2015-08-07_19-54-51_DSCF1749.jpg