Small Data: Ein neues Blog über Daten

In Deutschland wurde immer schon nur von Datenschutz, also dem Missbrauchspotenzial und der notwendigen Gegenwehr, gesprochen. Positive Folgen aus einer Zunahme an Informationsflüssen war hierzulande nie ein Thema. Nachvollziehbarerweise hat sich diese negative Sicht durch den Überwachungsskandal gefestigt.

Das bedeutet aber nicht, dass damit alles abgedeckt wäre.

Markus Spath startet ein neues Blog zum Thema Datennutzung:

Mein Thema für die nächsten 5 oder so Monate wird dabei – der Name deutet es an – Daten sein. Big Data ist natürlich als ominöse Bedrohung der Gesellschaft oder zumindest als Gespenst in aller Munde, aber ich möchte hier den quasi standardisierten Blickwinkel von uns als ohnmächtigen Objekten und unfreiwilligen Produzenten von gigantischen Datenbergen (als Futter für gierige, datenhungrige Unternehmen, Geheimdienste, usw.) umkehren und schauen, inwieweit wir selbst Subjekt über Daten werden können und was uns das bringen kann [..]

Themen könnten also sein: Open Data und assoziierte APIs; ‘Umgebungen’ wie Hadoop, GAE, Pandas oder (besonders) R; pragmatische Tools wie Numbers oder Google Spreadsheets; Statistik und Wahrscheinlichkeitstheorie; Quantified Self; Daten-Visualisierung; Datenjournalismus; Data Analysis; Bücher und Moocs zum Thema; usw. Ich nenne das jedenfalls mal heuristisch Small Data.

Der Zeitpunkt könnte, auch mit dem kurz bevor zu stehenden Markteintritt von Apples Smartwatch, kaum besser sein.

Ich hatte vor einigen Jahren auf neunetz.com eine neue Kategorie „Datennutzung“ angelegt, die etwas neutraler als „Datenschutz“ auf negativ oder positiv zu bewertende Datennutzungsformen verweist.

Auszugsweise ein paar Artikel aus dieser Kategorie:

 

Selbst Facebook trackt weniger als die FAZ

Caspar Clemens Mierau:

Erst gestern erschien in der FAZ der vielbeachtete “Aufruf der Schriftsteller“, in dem sich über 560 Autoren wie folgt äußern:

“Ein Mensch unter Beobachtung ist niemals frei; und eine Gesellschaft unter ständiger Beobachtung ist keine Demokratie mehr.”

Eine klare Forderung. Leider ist die Beobachtung von Benutzern ein so verlockend Effizienz-steigerndes Tool, dass beim Lesen des Artikels auf faz.net laut dem Browser-Plugin Ghostery immerhin 11 Tracking-Dienste eingesetzt werden – die die Daten zum großen Teil auch gleich in die USA transferieren (u.a. Doubleclick, Google Adsense/Analyics und Chartbeat)

Die FAZ ist damit wahrlich nicht allein, Mierau zählt NYT, Guardian und die taz auf, aber angesichts der Kampagne des FAZ-Feuilletons gegen “Big Data” und Daten allgemein, erscheint dieses Vorgehen recht scheinheilig:

Besonders lustig ist diese Tracker-Liste bei der FAZ, wenn man den FAZ-Service-Artikel “Wie wehre ich mich gegen Überwachung?” liest, in dem unter anderem die Frage aufgeworfen wird:

“Was wissen Google und Facebook denn über mich?”

Nun, in diesem Fall weiß Google zumindest, dass gerade der Artikel gelesen wird. Hätte man  der Ehrlichkeit halber ja mal hinschreiben können. Statt dessen wird aber lieber mit dem Finger auf das Internet gezeigt – so als passiere es eben “dort” und nicht “hier und jetzt”

Dieses Verhalten -Google und co. verdammen, aber gleichzeitig selbst nutzen- ist nicht neu für deutsche Medien, in denen auch schon zum Boykott von Google in Artikeln aufgerufen wurde, die von Google AdSense flankiert wurden.

Man mag das damit erklären, dass Verlag und Redaktion eigenständige  Unternehmenseinheiten sind, aber dann stellt sich trotzdem folgende Frage:

Wie viel ist eine Presse wert, die ein Verhalten auf eine grundsätzliche Art verdammt, dieses Verhalten aber selbst einsetzt, ohne Anzeichen zu machen dies zu minimieren oder gar ganz zu unterlassen?

Es scheint zumindest keine ehrliche Debatte zu sein.

Alles selbst hosten ist keine Antwort auf Prism und co.

Auf Facebook hat sich eine Diskussion mit unter anderem Markus Beckedahl zu den Themen Prism, Datenschutz und dezentrale Plattformen entsponnen. Ein Auszug aus einer Aussage von mir:

Wenn wir alles selber hosten, dann gehen die Regierungen und Nachrichtendienste eben zu den Hostern. Und dann? Die Ebene des Selbermachens und die Ebene der wirtschaftlichen Wertschöpfung zu verschieben und damit den Ansprechpartner zu ändern, löst dieses Problem nicht, weil es eben [..] eine politische Frage ist. Man muss das aufdröseln um zu Lösungen zu kommen. Oder zumindest um zu sehen, was keine Lösungen wären.

Der ewig gleiche Ruf etwa aus CCC-Kreisen, man solle die Dienste die man nutzen will auf dem eigenen Server hosten, ist nicht nur weltfremd gegenüber der Nutzerseite* und der Angebotsseite** sondern auch und vor allem keine Antwort auf Prism, Tempora und andere solche Programme.

-

* Wo der Aufwand ausgeblendet wird.

** Nicht alles kann auf vergleichbarem qualitativen Niveau dezentral betrieben werden. Spam-Schutz ist etwa immer im Aggregat effizienter. Dezentralität erhöht außerdem die Komplexität, sprich die Anzahl der Mittelsmänner und damit die potentiellen Einfallstore. Es ist also allein vom Architekturmodell betrachtet nicht a priori datenschutzfreundlicher als zentrale Systeme, eher im Gegenteil. Es geht hier natürlich um eine Frage der Kontrolle. Die wird aber, wie im Zitat ausgeführt wird, nicht durch Dezentralität gelöst sondern nur verlagert. Gelöst würde die Kontrollfrage nur, wenn 100(!) Prozent der debattierten dezentralen Lösung peer to peer realisiert würden.

Eine internationale Bürgerrechtsbewegung

Anja Seeliger fasst im Blog des Perlentauchers die Situation zusammen:

Offenbar spüren die Politiker jetzt doch, dass sich inzwischen eine beträchtliche Wut angestaut hat: Amerikanische und britische Geheimdienste speichern ungehindert und flächendeckend – und ohne den geringsten konkreten Anlass – millionenfach Telefonverbindungen und Internetdatensätze deutscher Staatsbürger. Die deutschen Gesetze, die ein Ausspionieren in diesem Umfang nie und nimmer erlauben, werden ignoriert. Bei Einreisen in die USA werden unsere Fingerabdrücke gespeichert und unsere Fluggastdaten in die USA transferiert. Unsere Bankdaten werden in die USA transferiert. Alles einseitig. Zugleich gelten wir als “Angriffsziel” und “Partner dritter Klasse”. Ist Deutschland noch ein souveräner Staat?

Das zurückhaltende, sich vorsichtig vortastende Vorgehen der deutschen Politiker ist erschütternd. Von einem entschiedenen, dem Ausmaß des Skandals angemessenen Vorgehen der Bundesregierung kann keine Rede sein.

Gleichzeitig wissen wir, dass europäische Geheimdienste mit Erkenntnissen der NSA gefüttert werden und selbst wiederum der NSA Informationen zuspielen. Wer also durch nationale Gesetze am Ausspionieren der eigenen Bürger gehindert ist, kann dies leicht umgehen, indem er bei Geheimdiensten anderer Länder nachfragt. Hier sind auch Fragen an den Internetkonzern Google zu stellen, der behauptet nur auf gerichtlichen Beschluss Daten herauszugeben: Gilt das nur für amerikanische Bürger oder auch für europäische?

Konsequenterweise meint Seeliger, das wir eine internationale Bürgerrechtsbewegung brauchen. Schaut man sich die Snowden-Petition auf Avaaz an, die weltweit bereits von über 1,3 Millionen Menschen gezeichnet wurde, könnte man die Basis einer solchen Bewegung vielleicht bereits erkennen.

Abgehörtes Deutschland

Markus Kompa auf Telepolis:

Die bis vor Kurzem geheimen Zusatzverträge überdauerten ebenso wie das NATO-Truppenstatut die Zwei-plus-Vier-Verhandlungen zur Herstellung der Deutschen Einheit von 1990 und sind als Recht der Siegermächte bis heute in Kraft.

[..]

Am 01.07.2013 tritt in Deutschland das Gesetz zur Bestandsdatenauskunft in Kraft, das zu Großteilen mit Prism identisch ist. Eine Geheimhaltung war nicht erforderlich, weil offenbar weder die Öffentlichkeit noch ein Großteil der beteiligten Politiker realisierten, was die Bestandsdatenauskunft überhaupt ist.

Alte geheime Zusatzverträge, die selbst das Grundgesetz aushebeln, und eine heute Entwicklungen gegenüber desinteressierte massenmediale Öffentlichkeit sorgen dafür, dass Deutsche keine Privatsphäre online haben.

Die verhältnismäßig geringe Entrüstung in den Massenmedien zu diessen Themen, deren Ausmaße nicht größer sein könnten, zeigt auch, dass die Datenschutzkritik an erfolgreichen US-Unternehmen vorher nicht Datenschutzbedenken sondern Konkurrenzbedenken zum Grund hatten.

Wir haben keine effektive Presse in Deutschland.

(via Marco Zehe)

Internetüberwachung: “Die Bundesregierung hat Briefe geschrieben und wartet auf Antwort.”

Nicolas Fennen auf netzpolitik.org:

Erschreckenderweise scheint das aber ganz gut aufzuzeigen, wie intensiv die Regierung an einer kompletten Aufklärung der Überwachung interessiert ist. Das von der britische Regierung keinerlei Antwort zu erwarten ist, hat diese schon sehr deutlich gemacht. Auf 13 Fragen der Bundesregierung antwortete diese in drei Zeilen.

Der deutschen Bundesregierung ist egal, ob ihre Bürger und Unternehmen von ausländischen Geheimdiensten konstant und komplett abgehört und überwacht werden.

Ich frage mich, ob der politische (und mediale) Aufschrei größer wäre, wenn die US-Amerikanischen und britischen Geheimdienste das komplette deutsche Telefonnetz abhören und mitschneiden würden und das an die Öffentlichkeit kommen würde.

Schön auch die Zitate aus der Bundestagsdebatte, etwa von Stephan Mayer, CSU:

Es ist nicht Aufgabe des Bundestages, die amerikanischen und britischen Geheimdienste zu kontrollieren.

Geheimdienste arbeiten geheim, es kann nicht alles auf dem Marktplatz der Weltöffentlichkeit erörtert werden.

Wir brauchen die Vorratsdatenspeicherung auch in Deutschland.

Ich hatte es gestern schon auf Twitter angesprochen, aber was ist eigentlich mit der Opposition? Warum dreht diese die Lautstärke nicht auf und nutzt diese Steilvorlage? Haben wir nicht in ein paar Monaten Bundestagswahl?

Was zur Hölle ist los in diesem Land?

Dringend Gesucht: Freiheitliche Rechtsstaaten

Thomas Stadler auf Internet-Law:

Ein Staat, der seine eigenen Bürger oder die Bürger fremder Staaten systematisch überwacht, kann sich nicht zugleich als freiheitlicher Rechtsstaat begreifen. Viele Menschen haben mit dieser Überwachung offenbar aber kein Problem, weil sie glauben, das würde sie nicht betreffen, sondern nur Terroristen oder Terrorverdächtige. Warum diese Annahme naiv und falsch ist, lässt sich im Grunde mit einem Wort erklären: Guantanamo. Dort werden seit Jahren Menschen festgehalten, die zu einem erheblichen Teil unschuldig sind und die nie ein ordentliches Gerichtsverfahren bekommen haben und auch nie eines bekommen werden.

[..]

Die Schrift Kants aus der ich zitiere, heißt übrigens “Zum ewigen Frieden”, der sich laut Kant nur dann einstellen wird, wenn im öffentlichen Bereich eine größtmögliche, ja sogar radikale Publizität herrscht.

Man muss also erkennen, dass Edward Snowden und Bradley Manning in der Tradition der Aufklärung stehen – was Julian Nida-Rümelin am Beispiel von Wikileaks überzeugend erläutert hat – während mächtige Strömungen in der internationalen Politik ihr entgegen arbeiten. Das Recht steht in diesem Fall ganz eindeutig auf der Seite Snowdens sowie all jener, die für Transparenz oder wie Kant es formulierte Publizität eintreten. Sie brauchen unsere Unterstützung und Solidarität im Kampf gegen lichtscheue Politik, damit das Recht hier letztendlich wirklich zum Zug kommen kann.

.

Ist Angela Merkel ausländische Industriespionage in Deutschland egal?

Anja Seeliger im Ententeich-Blog des Perlentauchers über Fragen, die sich bei PRISM und seinen Verwandten stellen, empörenderweise aber noch nicht debattiert werden:

Wusste die Bundesregierung, dass die Briten zusammen mit vier anderen englischsprachigen Nationen auch die gesamte Kommunikation Kontinentaleuropas ausspionieren? Wusste sie es, und hat amerikanische und britische Geheimdienste benutzt, um deutsche Einschränkungen und das Urteil des Bundesverfassungsgerichts zu umgehen, das die Vorratsdatenspeicherung für illegal erklärt hat? Indem sie klammheimlich von Erkenntnissen profitiert hat, deren Beschaffung nach deutschen Recht illegal gewesen wäre? Oder hatte sie keinen blassen Schimmer vom Treiben der fünf? In dem Fall sollte man neben dem Verfassungsschutz, der beim Zwickauer Nazi-Trio versagte, auch gleich den BND abschaffen.

Was ist mit den anderen kontinentaleuropäischen Regierungen? Die Zeitungen in Frankreich, Italien und Spanien scheinen sich derzeit vor allem für die fernsehkrimireife Flucht Snowdens zu interessieren. Dass ihre private, politische und wirtschaftliche Kommunikation von Britannien, USA, Australien, Kanada und Neuseeland abgehört wird, scheint noch nicht angekommen zu sein.

Sven Dietrich stellt die notwendige Anschlussfrage auf Twitter:

Was in der globalen Berichterstattung über Prism und Tempora vollständig fehlt: Industriespionage. Warum schreibt niemand darüber?

Besser als „Deutsches Google” wäre ein Europäischer Crawler, der seinen Index offen allen Anbietern bereitstellt

Server

 

Angenommen, man wolle ergebnisorientiert auf Deutscher Ebene, oder besser auf Europäischer Ebene, tatsächlich die Dominanz von Google im hiesigen Suchmaschinenmarkt senken; angesichts des 90+%-Marktanteils von Google etwa in Deutschland nicht zwingend verkehrt. Wie müsste man vorgehen? Eine staatliche Suchmaschine, wie das leicht zu vergessende Millionengrab „Deutsches Google”, ist sicher nicht die zielführendste Antwort.

Zunächst müsste man sich fragen, wo die Markteintrittsbarrieren im Suchmaschinenmarkt liegen und wie man diese mit staatlicher Hilfe senken könnte, um so das Ziel größeren Wettbewerbs zu erreichen.

Neben den Erfahrungswerten in der Gewichtung der Ergebnisse (Semantik, Rankingalgorithmen und Spambekämpfung) liegt die größte Markteintrittsbarriere bei Suchmaschinen vor allem in der aufwendigen Indizierung des Webs. Google indiziert mittlerweile neue Webseiten von bekannten Webpräsenzen innerhalb von Minuten(!). Das ist auch dank dem jahrelangen Aufbau von effizienten Serverparks in der ganzen Welt möglich. Das kann kein Startup mal eben nachmachen, weshalb es weitaus mehr Suchmaschinen als Crawler gibt.

Um der Konzentration auf dem Suchmaschinenmarkt staatlich entgegen zu wirken, ist es sinnvoll, eine oder mehrere dieser Hürden zum Markteintritt zu senken. Statt eine komplette gleichwertige Suchmaschine aufzusetzen, was eine zu hoch gesteckte Aufgabe ist, sollte die EU hier sich stattdessen auf die mit hohen Investitionen verbundene Infrastruktur konzentrieren. Diese wäre in diesem Fall der Webindex. Ein EU-Projekt könnte das öffentliche Web indizieren, umfänglich und schnell, und sich einzig darauf konzentrieren. Keine Bewertung, kein staatlicher Suchschlitz, nur der Index. Dieser könnte dann via Programmierschnittstelle kostendeckend anderen Institutionen, also Startups, NGOs und anderen Regierungsstellen, angeboten werden. Jetzt kommt die Arbeitsteilung ins Spiel: Diese könnten nun bei der Wertung und Verknüpfung innovativ tätig werden. (Natürlich könnte man auch zusätzlich ein Ranking anbieten und andere Aufgliederungsfaktoren, wie Themencluster, Sprachen etc. Wichtig ist die Konzentration auf die Vorstufe, also die Lieferung des ‘Rohmaterials’ sozusagen.)

Entscheidend ist die Beschränkung auf eine Ebene der Wertschöpfung, die investitionsintensiv ist und deshalb zu einer Markteintrittsbarriere für Suchmaschinen wird. Auf der Ebene, auf der Innovation gefragt ist, ist der Markt die bessere Lösung.

Das alles bedeutet nicht im Ansatz, dass Google Marktanteile und damit seine Marktmacht in Europa mittelfristig einbüßen würde. Es kommt nicht von ungefähr, dass Microsoft seit Jahren unzählige Millionen US-Dollar in seiner Suchmaschine versenkt ohne Google merklich weh zu tun.

Aber im Gegensatz zu einem staatlich finanzierten Suchmaschinenprojekt, das dank eines Alles-oder-Nichts-Ansatzes mit großer Wahrscheinlichkeit immer ein Millionengrab sein wird, könnte die Bereitstellung der Infrastruktur Innovationen im europäischen Digitalmarkt befördern. Für den Standortvorteil könnte man europäischen Unternehmen den Zugang zum Index und weiteren Daten auch unter Kosten anbieten. Subvention eben.

Sicher gebe es noch weitere Überlegungen, die man in dieser Richtung anstellen könnte. Entscheidend ist lediglich, zu wissen, wo die Hürden liegen und wo entsprechend staatliche Organisation und wo der Markt zum Einsatz kommen sollte, um ein bestmögliches Ergebnis zu bekommen. Und welches Ergebnis man möchte.

Wir wollen schließlich nicht, dass deutsche Innenpolitiker in einem Jahr ein “deutsches Facebook” fordern.

(Foto: Torkildr, CC-BY)

Für „Deutsches Google” sind bereits Subventionen in dreistelliger Millionenhöhe geflossen

In Folge der Prism-Aufdeckungen fordern deutsche Innenpolitiker, Experten vom Fach wie Dieter Wiefelspütz (SPD ) und Hans-Peter Uhl (CSU), eine deutsche Alternative zu Google und vergessen dabei, bewusst oder unbewusst, die unzähligen Millionen Euro, die bereits in solche Projekte auf Deutschlandebene und EU-Ebene geflossen sind.

Stephan Dörner gibt im Techblog des Wall Street Journal Nachhilfe in Geschichte:

Gemeint ist also: Deutschland – oder zumindest Europa – sollte auf die Übermacht amerikanischer Dienste im Internet reagieren – möglicherweise auch mit staatlich geförderten Alternativen. [..] Die deutschen Subventionen sind aber bereits geflossen – und zwar in dreistelliger Millionenhöhe. Der damalige Bundeskanzler Gerhard Schröder und Frankreichs damaliger Staatspräsident Jacques Chirac verkündeten 2005 das gemeinsame Forschungsprojekt für Suchmaschinen-Technologie Quaero – ein europäischer Konkurrent ist dabei bis heute nicht herumgekommen. Ende 2006 zog sich Deutschland aus dem Projekt zurück und begann ein deutsches Forschungsprogramm namens Theseus. Das Programm wurde nach Angaben des Bundeswirtschaftsministeriums mit 100 Millionen Euro gefördert und 2012 abgeschlossen, es befindet sich in der Phase der Auswertung. Es gäbe über 1.700 konkrete Ergebnisse. Darunter 130 Prototypen, knapp 60 Patente und andere geschützte Ergebnisse, 19 Standardisierungsaktivitäten, 5 Existenzgründungen und rund 900 Publikationen. Ein deutsches Google war allerdings nicht dabei.

Der Ruf nach deutschen, staatlich finanzierten Alternativen ist die Vorstufe zum unüberlegten Aktionismus: Von der Realität losgelöste Aussagen, die Schlagzeilen für uninformierte Bürger produzieren sollen, immerhin ist Bundestagswahljahr.

Selbst wenn man hinter der Aussage stehen würde, wäre der Ruf nach deutschen Alternativen – auf der gleichen Ebene der Operation und der Qualität – bestenfalls naiv. Als sei das Anbieten einer Google-Alternative nur eine Frage der Entscheidung.

Amüsant in diesem Zusammenhang natürlich immer auch die FAZ:

Der FAZ-Herausgeber Frank Schirrmacher ist voll auf dieser Linie und schreibt: „Das braucht Subventionen, eine Vision groß wie die Mondlandung. Aber auch das Silicon Valley ist das Ergebnis von fünfzig Jahren staatlicher Subvention.“ Tatsächlich ist das Silicon Valley vor allem ein Ergebnis enger Zusammenarbeit von US-Militär, Universitäten und Tech-Unternehmen.

Ich wiederhole meine Frage diesbezüglich gern noch einmal: Die FAZ war massgeblich daran beteiligt, das Presseleistungsschutzrecht mittels Propaganda zum Gesetz werden zu lassen. Wenn ein FAZ-Herausgeber nun in einer Welt mit dem Presseleistungsschutzrecht eine staatliche Suchmaschine fordert, fordert er dann am Ende eine staatliche Teilfinanzierung der FAZ?

Die ultimative Datenkrake Bertelsmann: “Kindergärten angetestet”

Richard Gutjahr:

Das Sammeln der Daten erfolge in Wellen, berichtet ein Mitarbeiter. Ein- bis zweimal im Jahr käme ein neuer Auftrag von der [Bertelsmann-Tochter] inmediaONE, dann heißt es, man brauche wieder 300.000 bis 400.000 Adressen.32.000 Schulen in ganz Deutschland sowie in Österreich werden mit jeder Sammelaktion angeschrieben. Die Akzeptanz sei hoch, heißt es. Nur eine von 5 Bildungseinrichtungen lehne das Angebot für Gratisbücher ab.

In mindestens 2 Erhebungswellen habe man dabei auch Kindergärten “angetestet”. Das habe aber nicht sonderlich gut funktioniert. Bei den Schulen sei die Rücklaufquote mit 50-60 Prozent aller ausgegebenen Gutscheinkarten deutlich höher. Die Postkarten mit den Angaben zu den Schülerinnen und Schülern werden maschinell ausgelesen; jede Adresse mit einem Image-Scan hinterlegt, um den Eingang der Karte zu belegen.

[..]

Anstelle der WKV kümmert sich seit Anfang 2013 die Bertelsmann-Tochter AZ direct um das Sammeln der Kinder-Daten. Auf ihrer Web-Seite wirbt AZ direct u.a. damit, über Daten von über 40 Millionen Haushalten zu verfügen mit “mehr als 250 kombinierbaren Merkmalen, zum Beispiel zu Soziodemografie, Psychografie, Konsumeigenschaften und Lebensphasen”. Mit den Daten aus den Kindergärten und Schulen ist hierfür sicher ein guter Grundstein gelegt.

Richard Gutjahr und das Lobbyplag arbeiten sich gerade an den Machenschaften von Bertelsmann ab. Siehe auch “LobbyPlag: Die Datenfänger von Gütersloh”:

Mit Millionen von Gutscheinen, die Bertelsmann an deutschen und österreichischen Schulen verteilt, geht der Medienkonzern gezielt auf Adressenjagd von Minderjährigen – und läuft Sturm gegen die geplante Datenschutzverordnung in Brüssel.

Drei Tage nach dem ersten Artikel: Während Facebook und Google nur blinzeln müssen wenn ein Datenschutzbeauftragter im Raum ist, um Leitartikel und Titelseiten über Datenkrakenskandale zu provozieren, hat die Veröffentlichung dieser unfassbaren Vorgänge bis dato laut Google News nur einen Artikel im Branchenblatt W&V nach sich gezogen, worin die Bertelsmann-Tochter Inmedia One zu Wort kommt.

Facebook ermöglicht Werbekunden, ‘ähnliches Zielpublikum’ auf Facebook zu finden

Inside Facebook:

Advertisers in the beta have seen lower costs per action than with traditional targeting options.

Lookalike Audiences can be created after an advertiser has uploaded a list of first-party data, such as customer email addresses, phone numbers or user IDs to make a Custom Audience. Facebook’s algorithms analyze the Custom Audience and produce another audience segment that is likely to have a similar customer profile. The advertiser can then create any Facebook ad type and target it to the Lookalike Audience. No personally identifiable information is shared back with advertisers and Lookalike Audiences can only be used within Facebook, not exported for email marketing or other ad targeting.

Werkzeuge wie dieses könnten Facebook zu einer Goldmine ähnlich Googles AdSense machen.

Nicht zuletzt auch, weil ebenso wie Google mit AdWords und AdSense Facebook aktuell der einzige Anbieter für so etwas im großen Stil sein kann. (Und erst im großen Stil wird ein solches Matching überhaupt interessant.)

Mögliche Suchen mit Facebook Graph Search

Ein Tumblr mit interessanten Ideen für Facebooksuchen: Actual Facebook Graph Searches:

“Current employers of people who like Racism”

Kai Biermann bezeichnete die neue Facebooksuche zum Launch in den USA auf Zeit Online als “Rasterfahndung für alle”. Das ist recht treffend und ich würde das nicht ausschließlich negativ lesen. Der entscheidende Teil ist “für alle”. Das verändert das Wesen der Datenauswertung ganz wesentlich.

Wie dem auch sei: Sollte die Facebook Graph Search in den nächsten sechs Monaten in Deutschland starten, kenne ich jetzt schon das Aufregerthema für das Sommerloch 2013.

Vielleicht schafft Deutschland noch einmal, was es mit Google Street View geschafft hat, dessen Verpixelung viele damalige Verpixelungsbefürworter mittlerweile nicht mehr so gern sehen dürften.

(via Nerdcore)

Datenkrake Handelsblatt kauft Abonnentendaten der FTD

Deutsche Wirtschafts Nachrichten:

Das Handelsblatt wird die Abo-Kartei der FTD abgleichen und den FTD-Beziehern ein unwiderstehliches Angebot unterbreiten.

Das gute alte Listenprivileg, das die Presseverlage zum Adresshandel privilegiert.

Darauf kann man verweisen, wenn demnächst wieder im Handelsblatt von den Datenkraken Google und Facebook die Rede sein wird.

Die Website der FTD wird wohl inklusive ihres Archivs vom Netz genommen.

Barack Obamas Kampagne setzte erfolgreich auf Big Data

Obama Wins: How Chicago’s Data-Driven Campaign Triumphed | TIME.com:

But from the beginning, campaign manager Jim Messina had promised a totally different, metric-driven kind of campaign in which politics was the goal but political instincts might not be the means. “We are going to measure every single thing in this campaign,” he said after taking the job. He hired an analytics department five times as large as that of the 2008 operation, with an official “chief scientist” for the Chicago headquarters named Rayid Ghani, who in a previous life crunched huge data sets to, among other things, maximize the efficiency of supermarket sales promotions.

[..]

The numbers also led the campaign to escort their man down roads not usually taken in the late stages of a presidential campaign. In August, Obama decided to answer questions on the social news website Reddit, which many of the President’s senior aides did not know about. “Why did we put Barack Obama on Reddit?” an official asked rhetorically. “Because a whole bunch of our turnout targets were on Reddit.”

(via tristessedeluxe)

Facebook Privacy Watcher macht Privatsphäreeinstellungen farblich sichtbar

allfacebook.de über ein Firefox-Addon von Studenten und Forschern der TU Darmstadt:

Für die Visualisierung werden dabei die entsprechenden Bereich der Facebook Seite farblich hinterlegt:

Grün: Jeder auf Facebook kann Ihre Daten sehen

Orange: Nur für Freunde sichtbar

Rot: Vor allen Benutzern versteckt

Blau: Für eine Teilmenge Ihrer Freunde sichtbar

Facebook sollte selbst so eine Ansicht als Kontrolloption für die Privatsphäreinstellungen anbieten. Anders lässt sich die Komplexität der Einstellungen kaum handhaben.

Maps sind für mobiles Web, was Webindex von Suchmaschinen für das Desktop-Web ist

Maps sind, das dürfte auch dem letzten nach dem aktuellen Drama um Google Maps und Apple Maps aufgegangen sein, der vielleicht wichtigste Baustein der langsam heranrollenden mobilen Webrevolution.

Maps sind, wenn man so will, das Äquivalent zum Webindex für das lokal getriebene Web. So wichtig, wie die Websuche für das ortsungebundene Web ist, so wichtig sind Maps für das mobile, oft  lokal getriebene Web.

Sie sind die Basis, auf der das mobile Web steht. Deswegen sind eigene Karten für Plattformprovider, von Apple über Google bis Amazon, strategisch wichtig.

Deshalb ist es besonders interessant, was Alexis C. Madrigal in The Atlantic über Nokias Maps schreibt:

There’s a third company that’s invested billions of dollars, employs thousands of mapmakers, and even drives around its own version of Google’s mythic “Street View” cars. 

That company is Nokia, the still-giant but oft-maligned Finnish mobile phone maker, which acquired the geographic information systems company Navteq back in 2007 for $8 billion. That’s only a bit less than the Nokia’s current market value of a bit less than $10 billion, which is down 93 percent since 2007. This might be bad news for the company’s shareholders, but if a certain tech giant with a massive interest in mobile content (Microsoft, Apple, Yahoo) were looking to catch up or stay even with Google, the company’s Location & Commerce unit might look like a nice acquisition they could get on the cheap (especially given that the segment lost 1.5 billion euros last year).

Das faszinierende ist, dass Nokia zumindest in den USA Zugang zu quantitativ – und damit in Aggregation auch qualitativ -hochwertigen Daten hat, von denen Apple als auch Google nur träumen können. Die GPS-Daten von den Paketdiensten FedEx und UPS:

People pointed out that while Google’s driven 5 million miles in Street View cars, UPS drives 3.3 billion miles a year. Whoever had access to these other datasets might be in the mapping (cough) driver’s seat.

Well, it turns out that Nokia is the company that receives the GPS data from both FedEx and UPS, the company’s senior VP of Location Content, Cliff Fox, told me.

Fazit: Wenn die neue Lumia-Reihe von Nokia mit Windows 8 floppt, entsteht eine Marktsituation, in der Nokias Maps-Abteilung zum Verkauf stehen könnte. Der Preis dürfte dann nicht einmal bei einem Zehntel der Kriegskasse von Apple liegen.

Zusätzlich ist es naheliegend, dass Apple und andere Unternehmen wie Amazon etwa künftig verstärkt auf Postdienste in aller Welt zugehen, weil diese auf einmal in einer Welt, in der Maps strategisch wichtig werden, auf einem Datenschatz sitzen. Sie wären dumm, würden sie es nicht tun.

Die Angst der Deutschen Bahn vor dem Datenkontrollverlust

Kai Biermann im Data Blog von Zeit Online über die Weitergabe der Zugverbindungsdaten der Deutschen Bahn an Google:

Warum gibt die Bahn die Daten Google, statt sie jedem zugänglich zu machen? Warum nutzt der staatseigene Konzern nicht die Chance, offene Daten zu fördern? Um Geld soll es nicht gegangen sein, schreibt Spiegel Online. Worum dann? Angst vor der Kreativität anderer?

Das klassische deutsche Verhalten: Kontrolle um jeden Preis. Wortwörtlich.

Das Problem ist nicht, dass die Bahn ihre Daten Google gegeben hat, sondern dass sie sie nicht frei verfügbar macht. Selten dürfte der vom Kontrollwunsch getriebene Irrweg (aus gesamtgesellschaftlicher Sicht) so offensichtlich sein wie bei diesem Fall.

‘Facebook ist auch Diensteanbieter im Sinne des Telekommunikationsgesetz’

Rechtsanwalt Thomas Stadler: Brauchen wir ein Telemediengeheimnis?:

Facebook ist – soweit es Kommunikation ermöglicht – auch Diensteanbieter im Sinne des TKG, denn Telekommunikation ist der technische Vorgang des Aussendens, Übermittelns und Empfangs von Nachrichten. Und diese technische Dienstleistung erbringt Facebook für seine Nutzer. Das Chat-System und das Direktnachrichtensystem von sozialen Medien unterliegt daher dem Fernmeldegeheimnis des TKG. Wir brauchen also keineswegs ein Telemediengeheimnis. Es besteht insoweit keine Gesetzeslücke.

Was wir hier vielmehr beobachten können, ist ein altbekanntes Problem speziell im Umgang mit US-Anbietern, das ich als Vollzugsdefizit bezeichnen würde. Anbieter wie Facebook oder Gooogle verstoßen häufiger gegen deutsches und europäisches Recht, u.a. auch beim Datenschutz. Der deutsche Staat, wie auch die EU, sind in vielen Fällen nur nicht mehr dazu in der Lage, ihr Recht gegenüber diesen Anbietern durchzusetzen.

Neben dem Vollzugsdefizit sehe ich hier auch Fragen der sinnvollen Anwendungsfälle, wie ich im vorherigen Artikel ausgeführt hatte. Wie auch das Urheberrecht muss auch dieses Gesetz mit der digitalen Realität abgeglichen und neu evaluiert werden.

Private Chats sind 2012 nicht das, was Briefe 1948 waren.

Weil Facebook private Chats algorithmisch auswerten und auch bereits von Mitarbeitern hat auswerten lassen, fordert Sascha Lobo auf Spiegel Online nachvollziehbarerweise ein neues “Telemediengeheimnis“. Ein Gesetz, das das Briefgeheimnis auf Webdienste übersetzt. Er schreibt unter anderem:

Private Chats sind 2012 das, was Briefe 1948 waren.

So sehr ich die Grundintention verstehen kann, so muss ich trotzdem festhalten, dass die Prämisse nicht korrekt ist. Wer 1948 einen Brief an einen Freund geschickt hat, war auf die Post angewiesen. Wer heute auf Facebook mit einem Freund chattet, kann stattdessen auch Emails, GTalk, AIM, Jabber, Windows Live Messenger oder VZ- nutzen. Daraus folgen eine Handvoll Schlussfolgerungen:

1. Die Wahlmöglichkeit der Systeme minimiert das Problem.

2. Einige dieser Systeme kommen nicht von zentralen Providern mit Profitabsichten. Namentlich Jabber und Email lassen sich ohne weiteres verhältnismäßig sicher aufsetzen und nutzen. Bei beiden gibt es auch entsprechende Institutionen, die explizit Dienste in diese Richtung anbieten.

3. Wir stehen noch immer am Anfang einer gewaltigen Entwicklung, die man als große gesellschaftliche Experimentierphase wahrnehmen muss, auch und besonders, wenn es um gesetzgeberisches Vorgehen geht. Jede Regulierung kann in unserer heutigen Umbruchsphase ungeahnte Nachteile mit sich bringen. Und damit meine ich nicht einmal die Fundamentalisten rund um Herrn Gorny, weil mir nicht einfallen will, wie diese Gruppe ein solches Gesetz für sich nutzen könnte. (Was nicht heißt, dass dem Bundesverband Musikindustrie nicht doch etwas einfallen könnte.) Ich meine eher Funktionalitäten, die sich auch rund um eine private Unterhaltung flechten lassen. Automatische, semantische Analyse, die Zusatzdaten bereitstellt etwa. Und ungefähr ibzehn weitere Dinge, die wir uns heute noch nicht vorstellen können.

Mit einem Telemediengeheimnis wären folgende Szenarien möglich:

  • a.) Man kann als Nutzer auf dieses Recht verzichten. Auf diese Weise wird sichergestellt, dass die in (3) beschriebenen potentiellen Funktionen angeboten werden können. Ein wahrscheinliches Ergebnis: Anbieter wie Facebook nehmen die Genehmigung in die AGB auf. Es bleibt praktisch alles wie bisher.
  • b.) Auf dieses Recht kann nicht verzichtet werden. Private Kommunikation wird nur übermittelt, darf nicht verarbeitet, ausgewertet oder aufbereitet werden. Weitere Funktionen sind damit praktisch verboten. Reichhaltige Zusatzfunktionalität gibt es nur bei öffentlicher Kommunikation. User werden dazu gedrängt, eher öffentlich zu kommunizieren, wenn sie dies und jenes möchten. (Lustiger Nebeneffekt: Das Drängen zur öffentlichen Kommunikation ist auch so schon im Interesse von Facebook und co.)

Mir geht es nicht darum, der Überwachung von privater Kommunikation das Wort zu reden. Mir geht es darum, dass hinter solchen zunächst nachvollziehbaren Forderungen, die in Deutschland natürlicher- und frustrierenderweise immer breiten Beifall finden, ein enormer Rattenschwanz an Problemen und Herausforderungen und last not least an potentiell enormen gesellschaftlichen Kosten liegen. Warum? Weil wir aktuell nicht in einer Zeit der Stabilität leben. Wir leben in einem Zeitalter des gesellschaftlichen Umbruchs, der nicht gestern begonnen hat und heute vorbei ist, sondern der noch auf Jahrzehnte andauern wird.

Was wäre eine sinnvolle Gesetzgebung vor diesem Hintergrund? Sie sollte nicht den Wettbewerb zwischen den Systemen und damit deren Weiterentwicklung behindern. Sie sollte also immer wenn möglich nicht auf die Funktionen selbst abzielen. Stattdessen wäre es sinnvoll, die Kommunikation zwischen Anbietern von Webdiensten und Nutzern stärker zu regulieren. Ein klarer, gesetzlich vorgeschriebener Hinweis etwa, dass ein privater Chat auf Facebook mitgeschnitten und ausgewertet wird, würde den Boden ebnen für selbstbestimmte Nutzerentscheidungen darüber, ob ihnen das egal ist oder ob sie lieber auf Alternativen ausweichen.

Bleibt die Frage, warum in Deutschland tendenziell eher auf Regulierung statt auf Wettbewerb gesetzt wird. Es könnte etwas mit Menschenbildern zu tun haben.

***

P.S.: Kein neues Gesetz sollte sich jemals danach richten, ob “Die Eltern des Grundgesetzes es so gewollt” hätten. Entweder ist es ein Gesetz, auf das sich die Gesellschaft heute als wünschenswert einigt oder nicht. Vermutete Meinungen toter Frauen und Männer sind irrelevant.