Der Schockwellenreiter Rotating Header Image

Netzeitung, das können wir besser

OPML Mug Die automatisch erstellte Netzeitung ist eine lieblos hingeschlampte Katastrophe, was um so mehr schmerzt, da sie früher, als sie noch eine Redaktion hatte, eine gern konsultierte Quelle für mich war. Jetzt aber …

Das Auslesen von Feeds kann Google News besser und man kann sich dort wenigstens seine eigenen Präferenzen zusammenstellen. Wenn man das auch noch ausgedruckt haben will, gibt es das anachronistische Angebot von Personal News, die einem doch tatsächlich aus dem Internet eine personalisierte Zeitung zusammenklauben und diese dann zum Ausdrucken (PDF, 16 MB) per Email an den Kunden schicken.

Das können wir besser! Hier ist meine Idee für eine personalisierte Zeitung auf dem Desktop:

Kern ist ein »Webserver auf dem Desktop« — in diesem Fall der OPML Editor, weil ich den am Besten kenne, aber Django, Rails oder andere Frameworks, die lokal als Webserver laufen können, sind genau so geeignet. Ähnlich wie bei meiner Frage nach der Organisation des Lifestreams baut man sich dann etwas, das die Feeds der Wahl auslesen kann und im Browserfenster hübsch aufbereitet. River2 bietet im Fall des OPML Editors schon eine gute Ausgangs­basis.

Jetzt kommt der Clou: Die ersten Wochen sind eine Lernphase, in der man mit Hilfe eines Bayes-Filters — ähnlich wie beim Spam — oder eines neuronalen Netzes dem Server mitteilt, welche Nachrichten man lesen möchte und welche man für überflüssig hält, also was Ham und was Spam ist. So kann man seinen Nachrichtenstrom hervorragend individualisieren. Und nach der Lernphase sollte das auch ohne weiteres Eingreifen des Nutzers funktionieren — auch wenn man vermutlich immer mal wieder »nachjustieren« muß..

Ein Problem ist noch, daß die Nachrichten so nur gelesen werden können, wenn man zu Hause ist. Da bieten sich mehrere Lösungen an:

  1. Man packt das ganze System nach der Testphase auf einen öffentlich zugänglichen Server. Das hat den Vorteil, daß man auch andere mitlesen lassen kann. Der Nachteil ist aber, daß das sicher nicht ganz billig ist.
  2. Eine Variante dieser Lösung ist es, die Cloud zu nutzen. Winer hatte schon einmal eine Anleitung veröffentlicht, wie man den OPML Editor auf EC2 zum Laufen bekommt. Wenn man den Server nur wenige Male am Tag hochfährt, die Nachrichten suchen läßt und diese dann liest, kann das eine sehr kostengünstige Lösung sein.
  3. Eine eher exotische Lösung ist es, mithilfe von Instapaper und/oder Dropbox die Nachrichten zugänglich zu machen. Aber sie hat durchaus ihren Charm, da sie es erlaubt, auch offline auf dem iPhone, iPad oder einem eBook-Reader wie Amazons Kindle und natürlich am Computer zu lesen. Selbst ein Ausdruck auf Papier ist möglich. Auch hier hat Winer schon einmal vorge­macht, wie so etwas aussehen könnte.
  4. Der OPML Editor kann seit einiger Zeit auch statische Seiten herausschreiben. Das wäre die von mir bevorzugte Lösung, auch weil sie eine klare Trennung zwischen Redaktions- und Produktionsserver bietet. Ist bei diesem Beispiel vielleicht ein wenig mit Kanonen auf Spatzen geschossen, aber die Idee eines Webservers auf dem Desktop läßt einen ja noch an viele andere Applikationen denken, die man via statischer Seiten auch an Apples AppStore vorbei auf den iPad schmuggeln könnte. So müßten zum Beispiel diese statischen Seiten ja nicht nur HTML-Seiten sein, sondern auch Seiten im Epub-Format. Dem OPML Editor ist das egal, das ist nur eine Frage der Templates.
  5. Last but not least: Da das Ganze ja eine Anwendung für einen Nutzer ist, ist sie sicher nicht so ressourcenhungrig, daß man nicht via DynDNS oder ähnlichen Diensten seinen Rechner zu Hause auch von außen zugänglich machen könnte.

Die Idee verfolgt mich seit einigen Jahren, leider habe ich bisher nicht die Zeit gefunden, sie zu realisieren. Vielleicht will sie ja ein anderer mal nachbauen. Besser als die Netzeitung können wir doch schon lange …

Teilen:
  • Facebook
  • del.icio.us
  • Google Bookmarks
  • MySpace
  • PDF
  • RSS
  • Technorati
  • email
  • Wikio
  • Digg
  • Identi.ca
  • MisterWong.DE
  • Posterous
  • Twitter
  • Print
  • Yigg
  • LinkedIn
  • FriendFeed
  • Tumblr

3 Kommentare

  1. Matt sagt:

    Ich hab so einen Naive-Bayes-basierten Feed-Filter mal für dzone gebaut. Funktionierte dort recht gut, weil für jedes Item eine kleine Auswahl von ca. 50 Tags vergeben wird, d.h. das Vokabular ist klein. Im Endeffekt baut man sich so ein Content-Based Recommender-System mit allen Vor- und Nachteilen, die man in der Literatur so findet (gibt genug Papers zum Thema).

    Ob das Prinzip auch gut funktioniert, wenn man auf die Item-Summary statt auf Tags geht, müßte man mal evaluieren. Wesentlich zuverlässiger sollte aber ein Collaborative Filtering-Ansatz sein, gerade wegen der begrenzten Datenbasis pro Item. Problem dabei: Skalierbarkeit und man bewegt sich im Patent-Minenfeld. Das Paper zu Google News ist in dem Kontext interessant.

    Personalisierung ist sicher eines der großen Themen für die nächsten Jahre. Die primitiven Angebote à la Slashdot, Dzone, Reddit und Digg sind definitiv nicht der Weisheit letzter Schluss. Der Web 2.0-Ansatz (viele User bauen an einer gemeinsamen Wahrheit) ist nicht das, was man haben will. Hier geht’s um Relevanz für den einzelnen User. Mit ein bißchen Voting ist es nicht getan.

  2. Jörg Kantel sagt:

    @Matt: Du schriebst: Das Paper zu Google News ist in dem Kontext interessant. Hast Du auch einen Link?

  3. Matt sagt:

    “Google news personalization: scalable online collaborative filtering” von Das et al (siehe http://portal.acm.org/citation.cfm?id=1242610). Über Google Scholar findet man ebenfalls PDFs.

    Im Wesentlichen haben sie ein Clustering-Verfahren verwendet, um schnell und skalierbar Nachbarschaftsverhältnisse zu bestimmen (die nutzen Eigenschaften des Jaccard-Koeffizienten). Ist meines Wissens alles patentiert, aber die Referenzen sind auch was wert. Einen guten generellen Überblick über Recommender gibt’s im Adomavicius-Paper (Referenz 1).

    Bayes-basierte Recommender sind anderswo untersucht worden, ich kann bei Bedarf zu Hause ein Paper raussuchen.

Einen Kommentar verfassen

Mit dem Absenden Ihres Kommentars willigen Sie ein, daß der angegebene Name, Ihre Email-Adresse und die IP-Adresse, die Ihrem Internetanschluß aktuell zugewiesen ist, von mir im Zusammenhang mit Ihrem Kommentar gespeichert werden. Die Email-Adresse und die IP-Adresse werden natürlich nicht veröffentlicht oder sonst weitergegeben.