Der Schockwellenreiter Rotating Header Image

Posts Tagged ‘Data Mining’

Warum Daten frei sein müssen

Drew Conway im Interview: Data science is a pipeline between academic disciplines.

Open source has also had a tremendous impact on how academics do research. First, open source tools for performing statistical analysis, such as R and Python, have robust communities around them. Academics can develop and share code within their niche research area, and …

R und Data Mining

Erdbeben und Atomkraftwerke

Diese interaktive Weltkarte zeigt alle Erdbeben der Stärke 4,5 und mehr seit 1973 und die Standorte aller aktiven Kernkraftwerke. So sieht man, daß unter anderem auch in Taiwan, Kalifornien, Italien und dem Iran Atomkraftwerke an gefährdeten Orten stehen.

Neu in meiner Bibliothek

Aufmerksame und regelmäßige Leser des Schockwellenreiters haben sicher mitbekommen, daß ich mich zur Zeit ein wenig an dem Begriff Datenjournalismus abarbeite. Einfach, weil ich denke, daß er mehr sein kann und muß, als ein paar Nädelchen auf Googles Landkarten zu setzen. Und hier kommen die Begriffe Data Mining und Datenanalyse ins Spiel, zu …

Haben wollen!

   

Ich habe mich mal wieder durch die (englischsprachigen) Neuerscheinungen meines Lieblings-EDV-Verlags gewühlt und bin fündig geworden.

Web Mining mit der Schlange

Pattern (BSD-Lizenz) ist ein Python-Modul, um Data Mining im Web durchzu­führen. Die Beispiele auf der Website (zum Beispiel dieses) machen Lust auf einen Test, vor allem, da die gefundenen Ergebnisse mit NodeBox visualisiert werden können.

Visualisierungs-Tutorial

Im Nachschlag zu meinen letzten Beiträgen ist mir dieses Tutorial auf IBM developerWorks untergekommen: Data visualization with Processing, Part 1: An introduction to the language and environment. Auf die Fortsetzung dürfen wir gespannt sein. (Ausdrucken!)

Gefunden habe ich dies und das obige Video in diesem Blogpost, der auch noch ein paar weitere Tips und Links …

Neu in meiner Bibliothek

Im Gegensatz zu anderen bin ich nicht der Meinung, daß eine Menge unstrukturierter (und unter Umständen ungeprüfter) Datensätze, wie sie zum Beispiel bei den Wikileaks-Enthüllungen anfallen, wertlos sind. Im Gegenteil, ich halte sie sogar für so etwas wie die Zukunft eines »neuen« Journalismus, das was unter Data Driven Journalism zur Zeit die Runde …

Daten erschließen und visualisieren

Wikileaks hat erneut geleckt. Doch was fangen wir nun mit den Daten an? Wir haben hier das Problem großer Mengen unstrukturierter Daten, die erschlossen und visualisiert werden müssen. Das ist relativ neue Arbeit, die geleistet und gelernt werden muß. Ein paar Links:

Der Klassiker und ungemein nützlich ist für mich immer noch das Buch …

Aufbereitung großer Datenmengen

Am Beispiel der Irak-Protokolle: Zähmung einer Datenflut. Wie geht man mit den knapp 400.000 Datensätzen um? Beispiele aus Spiegel Online, Guardian, New York Times, Al Jazeera und den Wikileaks selber.

Data Mining bei Amazon

Solange mir Amazon mit permanenter Beharrlichkeit jede Woche vorschlägt, daß ich doch bitte mein eigenes Buch kaufen möge — zusammen mit vielen anderen, die ich ebenfalls schon besitze (die habe ich nämlich alle bei Amazon gekauft) —, bin ich über die Datenspur, die ich bei dem Online-Riesen hinterlasse, nicht sonderlich besorgt.

Peters Linkschleuder

Mein emailender Dauertipgeber hat schon wieder so viele Links rüberwachsen lassen, daß ich sie nur noch summarisch abhandeln kann:

Gehostete Drupal-Seiten: Drupal Gardens launches in private beta. Sollte ich weiter beobachten.
Leben ohne Micro$oft: OpenOffice auf über 21 Prozent der Computer in Deutschland. Die Zahlen wurden mit einer interessanten Schnüffelmethode ermittelt. Ich hoffe, die Benutzer wurden …

Data-Mining als neue Form des Marketing

»Rasterfahndung« nach Meinungsmachern: Eine Studie zeigt, wie Soziale-Netzwerk-Analysen Gruppen filtern.