
By Nathan Marz
- Einführung in Big-Data-Systeme und -Technologien
- Große Datenmengen speichern und verarbeiten
- Einsatz zahlreicher instruments wie Hadoop, Apache Cassandra, Apache hurricane uvm.
Daten müssen mittlerweile von den meisten Unternehmen in irgendeiner shape verarbeitet werden. Dabei können sehr schnell so große Datenmengen entstehen, dass herkömmliche Datenbanksysteme nicht mehr ausreichen. Big-Data-Systeme erfordern Architekturen, die in der Lage sind, Datenmengen nahezu beliebigen Umfangs zu speichern und zu verarbeiten. Dies bringt grundlegende Anforderungen mit sich, mit denen viele Entwickler noch nicht vertraut sind.
Die Autoren erläutern die Einrichtung solcher Datenhaltungssysteme anhand eines speziell für große Datenmengen ausgelegten Frameworks: der Lambda-Architektur. Hierbei handelt es sich um einen skalierbaren, leicht verständlichen Ansatz, der auch von kleinen groups implementiert und langfristig betrieben werden kann.
Die Grundlagen von Big-Data-Systemen werden anhand eines realistischen Beispiels praktisch umgesetzt. In diesem Kontext lernen Sie neben einem allgemeinen Framework zur Verarbeitung großer Datenmengen auch Technologien wie Hadoop, hurricane und NoSQL-Datenbanken kennen.
Dieses Buch setzt keinerlei Vorkenntnisse über instruments zur Datenanalyse oder NoSQL voraus, grundlegende Erfahrungen im Umgang mit herkömmlichen Datenbanken sind aber durchaus hilfreich.
Aus dem Inhalt:
- Big-Data-Systeme und -Technologien
- Echtzeitverarbeitung sehr großer Datenmengen
- Lambda-Architektur
- Batch-Layer: Datenmodell, Datenspeicherung, Skalierbarkeit
- Stapelverarbeitungsprozesse
- Modellierung von Stammdatensätzen
- Implementierung eines Graphenschemas mit Apache Thrift
- Einsatz von MapReduce
- JCascalog zur Implementierung von Pipe-Diagrammen
- Serving-Layer: Konzepte und Einsatz von ElephantDB
- Speed-Layer: Berechnung und Speicherung von Echtzeit-Views
- Einsatz von Hadoop, Apache Cassandra, Apache Kafka und Apache Storm
- Streamverarbeitung mit Trident
Read Online or Download Big Data - Entwicklung und Programmierung von Systemen für große Datenmengen und Einsatz der Lambda-Architektur (mitp Professional) (German Edition) PDF
Best data mining books
High Performance MySQL: Optimization, Backups, and Replication
How will you carry out MySQL’s complete energy? With excessive functionality MySQL, you’ll examine complicated ideas for every thing from designing schemas, indexes, and queries to tuning your MySQL server, working process, and to their fullest strength. This consultant additionally teaches you secure and useful how you can scale functions via replication, load balancing, excessive availability, and failover.
Knowledge Discovery in Spatial Data (Advances in Spatial Science)
Whilst I ? rst came upon the time period info mining and information discovery in databases, i used to be excited and curious to ? nd out what it was once all approximately. i used to be excited as the time period has a tendency to exhibit a brand new ? eld that's within the making. i used to be curious simply because I puzzled what it used to be doing that the opposite ? elds of analysis, corresponding to information and the large ?
With immense facts analytics comes gigantic insights into profitability tremendous info is gigantic company. yet having the knowledge and the computational energy to technique it's not approximately sufficient to supply significant effects. sizeable information, info Mining, and laptop studying: price construction for enterprise Leaders and Practitioners is an entire source for expertise and advertising executives trying to minimize in the course of the hype and bring actual effects that hit the base line.
eXist: A NoSQL Document Database and Application Platform
Get a head begin with eXist, the open resource NoSQL database and alertness improvement platform outfitted totally round XML applied sciences. With this hands-on consultant, you’ll research eXist from the floor up, from utilizing this feature-rich database to paintings with hundreds of thousands of records to development advanced net functions that reap the benefits of eXist’s many extensions.
- A User's Guide to Business Analytics
- Statistical Data Mining and Knowledge Discovery
- Fifty Years of Fuzzy Logic and its Applications (Studies in Fuzziness and Soft Computing)
- Getting Started with Data Science: Making Sense of Data with Analytics (IBM Press)
- Community Detection and Mining in Social Media
Extra info for Big Data - Entwicklung und Programmierung von Systemen für große Datenmengen und Einsatz der Lambda-Architektur (mitp Professional) (German Edition)
Sample text
- East of the Oder: A German Childhood under the Nazis and by Luise Urban
- Joking Asides: The Theory, Analysis, and Aesthetics of Humor by Elliott Oring