Watir Click und Link

Ich fand ein paar coole Services, die RSS Feeds aus Website generieren sowie einen Duplicate Finder (Github), der für meine Bilddaten oder eine Whitelist auch nützlich sein sollte.

Quellenangabe ist bei meinem Blog dann wichtig. Statt über PHP das favivon zu checken, nehme ich doch lieber ein jQuery Plugin. Das sollte dynamischer sein.

Erst mal musste ich die Custom Fileds fixen und dann die richtigen Kategorien bekommen.

Ich muss mir die Kategorien vorschlagen lassen und die Werte dann übernehmen. Das mag bei Spielen gehen, für Elektronik usw. wird das schwieriger und benötigt dann eine Entscheidungsliste / Synonyme. Klassifizierung ist nicht so simple und deshalb lasse ich das erst mal raus und mache das wohl über ein WordPress Plugin, das auch für Categories statt Tags gehackt wurde aber ich sah auch, dass man die Taxonomie da direkt ändern konnte. Komfortabel kann man das seine Synonyme eintragen – alles bestens. Ich fand, dass meine Rewrite-Regeln die Kategorien und Tags nicht richtig anzeigten. Es ging also auch vorher aber ich bleibe beim Autotagger statt der Übertragung über XMLRPC, weil das zu fehleranfällig ist, als direkt in WP. Ein weiteres kleines Problem gelöst.

Eigentlich baue ich an Sachen, die nicht richtig mit dem Ziel zu tun haben. Schneller wäre ich wohl gleich mit FeedWordpress gekommen – aber naja. Es gibt sogar einen Duplicate-Filter, der aber eiegntlich fuzzy sein müsste. Es wird Zeit, das Ding zu launchen und dann eben auch die wichtigen Features einzubauen – die Affiliate Links. Das geht hoffentlich einfacher und besser mit Watir.

Ich testete ewig herum, um die Links zu erhalten und kam am Ende für mydealz auf dieses Fantastische Produkt:

browser.goto(browser.div(:class => "thread-deal tGrid-cell").link(:index => 0).href)

Zuerst also das DIV finden, darin dann das erste Link Element (XPath?), daraus dann die HREF als Text, was dann den Browser wiederum anstößt und nach den ganzen Sprüngen über
puts browser.url die End-URL ausgeben lässt.

Jetzt muss ich die Sache nur für jeden Blog bauen und bekäme so die echten nackten Links, wenn auch noch mit den diversen Affiliate Codes. Ruby rockt aber irgendwie, wenn solche Chains möglich sind. Mehr Magic als bei Python aber das gefällt mir als Laie.

Ich machte dann noch fix die Links für Snipz und Dealbunny, die beide auf Anhieb funktionierten. Echt gut aber ich muss irgendwie sehen, dass Firefx keine Bilder lädt und auch sonst schneller durch die Links wandert. Ich sehe nur, dass das über eine Proxy wie privoxy gehen soll. Wäre dumm.

So sollte ich die restlichen 10 Sites machen (schnaeppchenfee fällt villeicht raus) und dann in die SQLite DB übernehmen. Die echten Links kann ich dann auch per XMLRPC als Custom Tag übernehmen. So gesehen, ein weiterer Fortschritt für diese Art von Blog. Trotz eines Artikel – ein mulmiges Gefühl bleibt, je länger ich an der Sache arbeite.

Bis in den Morgen schaute ich mir noch „Quick Change“ an. Die Film mit Bill Murray hatte ich bisher noch nicht gesehen. War super.

Ich will dann auch noch irgendwann Gradify einbinden.

0 Responses to “Watir Click und Link”


Kommentare sind zur Zeit nicht möglich.
2015-08-03_15-20-47_2015-08-03-15.20.47.jpg
2015-08-03_15-20-47_2015-08-03-15.20.47.jpg
2015-08-03_23-12-26_DSCF1747.jpg
2015-08-03_23-12-26_DSCF1747.jpg