Lern fabrik

Bigdata - Web als Quelle

Als einfachstes Beispiel für Bigdata ist das Internet of Things (IoT). Im Internet der Dinge produziert jedes technologisches Gerät Daten - in großer Menge.

Wie groß ist Bigdata?

Der Begriff "Bigdata" bezieht sich nicht auf eine bestimmte Menge an Daten. Es gibt keine fest definierte Grenze, ab der Massendaten als Bigdata zu bezeichnen sind. In der Praxis wird der Begriff aber oft als Synonym für Größen gewählt, die nicht mehr in Gigabyte zu messen sind.

Wie entsteht Big Data?

Der Datenumfang hat immense Ausmaße angenommen: Die Menge an Daten, die die Menschheit von Beginn an bis ins Jahr 2002 angesammelt hat, entstand 2014 schon innerhalb von nur zehn Minuten. Laut Prognosen wird dieser Datenberg weiter steigen und sich weltweit im Zweijahrestakt verdoppeln. Die Datenflut ergibt sich durch die steigende Digitalisierung aller Lebensbereiche. Big Data entsteht dabei durch das Zusammenführen verschiedener Datenquellen wie:

Spricht man von Big Data, sind in der Regel nicht nur die Daten selbst, sondern auch deren Analyse und Nutzung gemeint. Man versucht Muster und Zusammenhänge zu finden und in den richtigen Kontext zu bringen. Die Herausforderung dabei ist nicht nur das riesige Datenvolumen, sondern auch die Datengeschwindigkeit und die Vielfalt der Informationen. Die Daten strömen ununterbrochen in einen unstrukturierten Pool. Sie sollen erfasst, gespeichert und verarbeitet werden, wenn möglich in Echtzeit. Um die Daten richtig lesen und in Zusammenhang bringen zu können, bedarf es einer ausgefeilten Dateninfrastruktur.

Schichten des Webs - erläutert am Eisberg-Modell

Surface Web

Beginnen wir mit dem Bereich, der oberhalb des Eisbergs liegt. Da dieser an der Oberfläche (engl. Surface) liegt, bezeichnet man diesen Teil auch als Surface-Web. Das Surface-Web umfasst alles, was wir täglich im Internet nutzen, z. B. Google, YouTube, Wikipedia, Amazon und all das, was man generell durch den Aufruf eines Links erreichen kann. Mit Suchmaschinen kann man Seiten in diesem Teil des Internets aufspüren. Dieser Teil des Internets macht nur ca. 4-5% des Internets aus. Diese Zahl weicht je nach Quelle ab, doch im Groben kann man von einem einstelligen Prozentbereich ausgehen. Um auf das Surface-Web zugreifen zu können, benötigt man einen Rechner, eine Internet-Verbindung und einen einfachen Browser. Es sind also keine speziellen Programme notwendig.

Deep Web

Einen weitaus größeren Anteil (nämlich ca. 90%) hat das Deep Web. Das ist der Teil des Internets, der sich über normale Suchmaschinen nicht finden lässt. Es schwimmt quasi unter der Oberfläche des Internets und ist deshalb schwer zu überschauen. Doch was enthält dieses Deep-Web, wenn das Surface-Web doch schon so schier endlos erscheint? Im Deep Web sind Informationen und Daten gespeichert, die nicht für die Öffentlichkeit bestimmt sind, also z. B. deine privaten E-Mails, in Clouds gespeicherte Urlaubsfotos, Facebook-Nachrichten oder PayPal-Kontodaten. Überall dort, wo man sich authentifizieren muss, um auf bestimmte Informationen zugreifen zu können, spricht man vom Deep Web. Man kann auch nicht über einen Link direkt darauf zugreifen und findet die Informationen nicht über klassische Suchmaschinen. Jetzt ist auch klar, weshalb das Deep Web so einen großen Teil des Internets ausmacht: Die meisten Daten werden nämlich hinter Passwörtern versteckt und sind nicht für jeden gedacht. Oder würden Sie, dass man über Google ihre Facebook-Chatverläufe auffinden und mitlesen kann? Vermutlich nicht. Auch für den Zugriff auf das Deep Web sind keine besonderen Tools vonnöten.

Dark Web (DarkNet)

Kommen wir nun zu dem berühmt berüchtigten Darknet, das sie nur mit dem Einsatz spezieller Tools (wie den Tor-Browser) betreten kannst. Man verwendet für das Darknet auch die Bezeichnung Dark Web, was im Vergleich des Surface, Deep und Dark Webs natürlich Sinn ergibt. Was enthält das Darknet? Nun, völlig verschiedene Dinge und entgegen der weitläufigen Meinung treiben sich hier nicht nur Kriminelle herum. Auch ist nicht alles, was im Darknet angeboten wird, automatisch illegal. Im Darknet findet man primär das, was bewusst verborgen wird. In aller Kürze sei erwähnt, dass diese Dienste nicht automatisch alle illegal sind, nur weil man sie im Darknet findet. Es sei aber erwähnt, dass dieser Ort natürlich auch für Kriminelle aufgrund des hohen Anonymitätsgrads attraktiv ist, da man dort mehr oder weniger ungestört bestimmte Dienste anbieten kann, die normalerweise illegal sind oder nur in manchen Ländern illegal sind. Wie bereits erwähnt braucht man den Tor-Browser, um ins Darknet zu kommen. Wenn sie etwas im Darknet kaufen möchten, dann sollte man wissen, wie Bitcoins erworben und mit ihnen bezahlt wird. Da man zur Wahrung der Anonymität selbstverständlich Kryptowährungen als Zahlungsmittel verwendet. Ansonsten könnte man sich die ganze Geheimhaltungsthematik im Vorfeld auch sparen. Zudem schadet es nicht, sich mit Linux Tails auseinanderzusetzen. Hierbei handelt es sich um ein Betriebssystem, das seinen Nutzern ein Höchstmaß an Anonymität gewährleistet.

Bereiche, in denen man von Big Data profitiert