Pentaho Data Integration Cookbook

Second Edition

Author: Alex Meadows,Adrián Sergio Pulvirenti,María Carina Roldán

Publisher: Packt Publishing Ltd

ISBN: 1783280689

Category: Computers

Page: 462

View: 4129

Pentaho Data Integration Cookbook Second Edition is written in a cookbook format, presenting examples in the style of recipes.This allows you to go directly to your topic of interest, or follow topics throughout a chapter to gain a thorough in-depth knowledge.Pentaho Data Integration Cookbook Second Edition is designed for developers who are familiar with the basics of Kettle but who wish to move up to the next level.It is also aimed at advanced users that want to learn how to use the new features of PDI as well as and best practices for working with Kettle.
Release

Learning Pentaho Data Integration 8 CE

An end-to-end guide to exploring, transforming, and integrating your data across multiple sources

Author: Maria Carina Roldan

Publisher: Packt Publishing Ltd

ISBN: 1788290070

Category: Computers

Page: 500

View: 7187

Get up and running with the Pentaho Data Integration tool using this hands-on, easy-to-read guide About This Book Manipulate your data by exploring, transforming, validating, and integrating it using Pentaho Data Integration 8 CE A comprehensive guide exploring the features of Pentaho Data Integration 8 CE Connect to any database engine, explore the databases, and perform all kind of operations on relational databases Who This Book Is For This book is a must-have for software developers, business intelligence analysts, IT students, or anyone involved or interested in developing ETL solutions. If you plan on using Pentaho Data Integration for doing any data manipulation task, this book will help you as well. This book is also a good starting point for data warehouse designers, architects, or anyone who is responsible for data warehouse projects and needs to load data into them. What You Will Learn Explore the features and capabilities of Pentaho Data Integration 8 Community Edition Install and get started with PDI Learn the ins and outs of Spoon, the graphical designer tool Learn to get data from all kind of data sources, such as plain files, Excel spreadsheets, databases, and XML files Use Pentaho Data Integration to perform CRUD (create, read, update, and delete) operations on relationaldatabases Populate a data mart with Pentaho Data Integration Use Pentaho Data Integration to organize files and folders, run daily processes, deal with errors, and more In Detail Pentaho Data Integration(PDI) is an intuitive and graphical environment packed with drag-and-drop design and powerful Extract-Tranform-Load (ETL) capabilities. This book shows and explains the new interactive features of Spoon, the revamped look and feel, and the newest features of the tool including transformations and jobs Executors and the invaluable Metadata Injection capability. We begin with the installation of PDI software and then move on to cover all the key PDI concepts. Each of the chapter introduces new features, enabling you to gradually get practicing with the tool. First, you will learn to do all kind of data manipulation and work with simple plain files. Then, the book teaches you how you can work with relational databases inside PDI. Moreover, you will be given a primer on data warehouse concepts and you will learn how to load data in a data warehouse. During the course of this book, you will be familiarized with its intuitive, graphical and drag-and-drop design environment. By the end of this book, you will learn everything you need to know in order to meet your data manipulation requirements. Besides, your will be given best practices and advises for designing and deploying your projects. Style and approach Step by step guide filled with practical, real world scenarios and examples.
Release

Pentaho Data Integration Beginner's Guide

Second Edition

Author: María Carina Roldán

Publisher: Packt Publishing Ltd

ISBN: 1782165053

Category: Computers

Page: 502

View: 1642

This book focuses on teaching you by example. The book walks you through every aspect of Pentaho Data Integration, giving systematic instructions in a friendly style, allowing you to learn in front of your computer, playing with the tool. The extensive use of drawings and screenshots make the process of learning Pentaho Data Integration easy. Throughout the book, numerous tips and helpful hints are provided that you will not find anywhere else.This book is a must-have for software developers, database administrators, IT students, and everyone involved or interested in developing ETL solutions, or, more generally, doing any kind of data manipulation. Those who have never used Pentaho Data Integration will benefit most from the book, but those who have, they will also find it useful.This book is also a good starting point for database administrators, data warehouse designers, architects, or anyone who is responsible for data warehouse projects and needs to load data into them.
Release

Learning Pentaho Data Integration 8 CE - Third Edition

Author: Maria Carina Roldan

Publisher: N.A

ISBN: 9781788292436

Category: Computers

Page: 500

View: 820

Get up and running with the Pentaho Data Integration tool using this hands-on, easy-to-read guideAbout This Book* Manipulate your data by exploring, transforming, validating, and integrating it using Pentaho Data Integration 8 CE* A comprehensive guide exploring the features of Pentaho Data Integration 8 CE* Connect to any database engine, explore the databases, and perform all kind of operations on relational databasesWho This Book Is ForThis book is a must-have for software developers, business intelligence analysts, IT students, or anyone involved or interested in developing ETL solutions. If you plan on using Pentaho Data Integration for doing any data manipulation task, this book will help you as well. This book is also a good starting point for data warehouse designers, architects, or anyone who is responsible for data warehouse projects and needs to load data into them.What You Will Learn* Explore the features and capabilities of Pentaho Data Integration 8 Community Edition* Install and get started with PDI* Learn the ins and outs of Spoon, the graphical designer tool* Learn to get data from all kind of data sources, such as plain files, Excel spreadsheets, databases, and XML files* Use Pentaho Data Integration to perform CRUD (create, read, update, and delete) operations on relationaldatabases* Populate a data mart with Pentaho Data Integration* Use Pentaho Data Integration to organize files and folders, run daily processes, deal with errors, and moreIn DetailPentaho Data Integration(PDI) is an intuitive and graphical environment packed with drag-and-drop design and powerful Extract-Tranform-Load (ETL) capabilities. This book shows and explains the new interactive features of Spoon, the revamped look and feel, and the newest features of the tool including transformations and jobs Executors and the invaluable Metadata Injection capability.We begin with the installation of PDI software and then move on to cover all the key PDI concepts. Each of the chapter introduces new features, enabling you to gradually get practicing with the tool. First, you will learn to do all kind of data manipulation and work with simple plain files. Then, the book teaches you how you can work with relational databases inside PDI. Moreover, you will be given a primer on data warehouse concepts and you will learn how to load data in a data warehouse. During the course of this book, you will be familiarized with its intuitive, graphical and drag-and-drop design environment.By the end of this book, you will learn everything you need to know in order to meet your data manipulation requirements. Besides, your will be given best practices and advises for designing and deploying your projects.Style and approachStep by step guide filled with practical, real world scenarios and examples.
Release

Learning Pentaho CTools

Author: Miguel Gaspar

Publisher: Packt Publishing Ltd

ISBN: 1785289373

Category: Computers

Page: 388

View: 8610

Acquire finesse with CTools features and build rich and custom analytics solutions using Pentaho About This Book Learn everything you need to know to make the most of CTools Create interactive and remarkable dashboards using the CTools Understand how to use and create data visualizations that can make the difference The author of our book works for Pentaho as a Senior Consultant Acts as a follow-up to Packt's previously published products on Pentaho such as Pentaho Business Analytics Cookbook, Pentaho Analytics for MongoDB, Pentaho Data Integration Cookbook - Second Edition, and Pentaho Reporting [Video] Our book is based on the latest version of Pentaho, that is, 6.0 Who This Book Is For If you are a CTools developer and would like to expand your knowledge and create attractive dashboards and frameworks, this book is the go-to-guide for you. A basic knowledge of JavaScript and Cascading Style Sheets (CSS) is highly recommended. What You Will Learn Install Community Tools on Pentaho; and understand the necessary concepts and considerations when creating an exciting dashboard design Get data from many different Pentaho datasources and deliver it in different formats (CSV, XLS, XML, or JSON) Use the Community Data Access (CDA) as the data abstraction layer and understand the concepts in the Community Dashboard Framework (CDF) Create a Community Dashboard Editor (CDE) dashboard and make the most of the main components Create and make use of widgets and use duplicate components to have data-driven sections on the dashboard Customize and create interaction between all components, including charts, using the Community Charts Components Create and embed dashboards in a better and new way Create plugins and make use of parameters inside Pentaho without writing code In Detail Pentaho and CTools are two of the fastest and most rapidly growing tools for practical solutions not found in any other tool available on the market. Using Pentaho allows you to build a complete analytics solution, and CTools brings an advanced flexibility to customizing them in a remarkable way. CTools provides its users with the ability to utilize Web technologies and data visualization concepts, and make the most of best practices to create a huge visual impact. The book starts with the basics of the framework and how to get data to your dashboards. We'll take you all the way through to create your custom and advanced dashboards that will create an effective visual impact and provide the best user experience. You will be given deep insights into the lifecycle of dashboards and the working of various components. Further, you will create a custom dashboard using the Community Dashboards Editor and use datasources to load data on the components. You will also create custom content using Query, the Freeform Addins Popup, and text components. Next, you will make use of widgets to create similar sections and duplicate components to reproduce other components on a dashboard. You will then learn to build a plugin without writing Java code, use Sparkl as a CPK plugin manager, and understand the application of deployment and version control to dashboard development. Finally, you will learn tips and tricks that can be very useful while embedding dashboards into other applications. This guide is an invaluable tutorial if you are planning to use custom and advanced dashboards among the solutions that you are building with Pentaho. Style and approach This book is a pragmatic, easy-to-follow guide that provides theoretical concepts, ideas, and tricks to better understand the necessary theoretical concepts. It also provides you with a set of highly intriguing samples of dashboards with customized code within them that can be utilized for future projects.
Release

Pentaho Business Analytics Cookbook

Author: Sergio Ramazzina

Publisher: Packt Publishing Ltd

ISBN: 1783289368

Category: Computers

Page: 392

View: 9133

This practical guide contains a wide variety of recipes, taking you through all the topics you need to quickly familiarize yourself with Pentaho and extend your Pentaho skillset. If you are involved in daily activities using Pentaho Business Analytics platform, this is the book for you. It is a good companion to get you quickly acquainted with everything you need to increase your productivity with the platform. We assume basic familiarity with Pentaho, data warehouse design and SQL, HTML, and XML.
Release

Visualize This!

Author: Nathan Yau

Publisher: John Wiley & Sons

ISBN: 3527760229

Category: Statistics / Graphic methods / Data processing

Page: 422

View: 455

A guide on how to visualise and tell stories with data, providing practical design tips complemented with step-by-step tutorials.
Release

Zum Wesen der Utopie und utopischen Elementen in Geheimbünden

Author: Holger Knaak

Publisher: GRIN Verlag

ISBN: 3640860144

Category:

Page: 24

View: 3090

Studienarbeit aus dem Jahr 2001 im Fachbereich Philosophie - Philosophie der Neuzeit (ca. 1350 - 1600), Note: 1-, Ernst-Moritz-Arndt-Universitat Greifswald, Veranstaltung: PS Fruhneuzeitliche Utopien, Sprache: Deutsch, Abstract: I. Einleitung Die Frage nach dem eigentlichen Wesen der Utopie wurde in den einzelnen Sitzungen des Seminars jeweils nur am Rande gestellt und eine tiefergehende Beantwortung blieb aus. Lediglich in der Sitzung vom 11.Juli, in der es u.a. um Johann Valentin Andraes Biographie ging, wurden im Kontext zu Richard von Dulmens Die Utopie einer christlichen Gesellschaft" einige Ausfuhrungen dazu gemacht. Zur Auswertung v.a. im Hinblick auf realhistorische Auswirkungen der gelesenen Texte ist eine weitergehende Klarstellung des Begriffs des Utopischen" unumganglich. Zwar enthalt Klaus J. Heinisch Nachwort zu dem die drei wichtigsten Texte enthaltenen Der Utopische Staat" eine ausfuhrliche Darstellung des gesellschaftlichen Hintergrundes der Autoren, der literarischen Gattungseinordnung und auch spaterer Wiederaufnahme etwa bei Marx und Mao, aber eine eindeutige Definition des Utopischen" fehlt auch hier. Das mag sicherlich an der komplexen Thematik selbst liegen, die eine klare und kurzgefasste Definition erschwert. Vergleicht man die klassische Utopie jedoch mit anderen benachbarten Ideenbegriffen bzw. literarischen Gattungen mag sich ein klareres Bild darstellen. Ein interessanter Ansatz dazu findet sich in Manfred Agathens Geheimbund und Utopie - Illuminaten, Freimaurer und deutsche Spataufklarung" (1987, Munchen), auf dessen Ausfuhrungen ich die meinigen grosstenteils stutze. Anhand des Vergleichs von Utopie" und Chiliasmus," den Agathen vornimmt, ergibt sich vielleicht doch so etwas wie eine brauch-bare Definition von Utopie." Im zweiten und Hauptteil dieser Textfassung mochte ich einige notwendige Informationen zur Uberlieferung und Synthese antiken, christlichen und vorderasiatischen sog. Geheimwissens - wie es sich etwa i.d. Her"
Release

Data Science für Dummies

Author: Lillian Pierson

Publisher: John Wiley & Sons

ISBN: 352780675X

Category: Mathematics

Page: 382

View: 5752

Daten, Daten, Daten? Sie haben schon Kenntnisse in Excel und Statistik, wissen aber noch nicht, wie all die Datensätze helfen sollen, bessere Entscheidungen zu treffen? Von Lillian Pierson bekommen Sie das dafür notwendige Handwerkszeug: Bauen Sie Ihre Kenntnisse in Statistik, Programmierung und Visualisierung aus. Nutzen Sie Python, R, SQL, Excel und KNIME. Zahlreiche Beispiele veranschaulichen die vorgestellten Methoden und Techniken. So können Sie die Erkenntnisse dieses Buches auf Ihre Daten übertragen und aus deren Analyse unmittelbare Schlüsse und Konsequenzen ziehen.
Release

Big Data in der Praxis

Beispiellösungen mit Hadoop und NoSQL. Daten speichern, aufbereiten, visualisieren

Author: Jonas Freiknecht

Publisher: Carl Hanser Verlag GmbH Co KG

ISBN: 3446441778

Category: Computers

Page: 448

View: 9226

BIG DATA IN DER PRAXIS // - Für Analysten, BI-Verantwortliche, Data-Scientists, Consultants - Auf der DVD finden Sie: 18 fertige Projekte, die im Buch Schritt für Schritt entwickelt werden; Videotutorials u.a. zur Installation von Hadoop, Hive, HBase (Gesamtdauer: 80 Min.); Testdatensätze für die Wissensdatenbank Dieses Buch bringt Ihnen das Thema Big Data auf sehr praktische Art und Weise nahe. Sie lernen Technologien, Tools und Methoden kennen, entwickeln Beispiel-Lösungen und bekommen aufgezeigt, wie Sie bestehende Systeme vorausschauend auf die mit dem Big Data-Trend einhergehenden Herausforderungen vorbereiten. Dazu werden Sie neben den bekannten Apache-Projekten wie Hadoop, Hive und HBase auch einige weniger bekannte Frameworks wie Apache UIMA oder Apache OpenNLP kennenlernen, um gezielt die Verarbeitung unstrukturierter Daten zu behandeln. Alle hier verwendeten Software-Komponenten stehen im vollen Umfang kostenlos im Internet zur Verfügung. Gemeinsam mit dem Autor werden Sie ganz konkret Schritt für Schritt viele kleinere Projekte aufbauen bis hin zu einer fertigen und funktionstüchtigen Implementierung. Ziel des Buches ist es, Sie auf den Effekt und den Mehrwert der neuen Möglichkeiten aufmerksam zu machen, sodass Sie diese konstruktiv in Ihr Unternehmen tragen können und für sich und Ihre Kollegen somit ein Bewusstsein für den Wert Ihrer Daten schaffen. AUS DEM INHALT // Einführung rund um Big Data // Hadoop installieren, konfigurieren & bedienen // HDFS, Map-Reduce & YARN: Daten speichern und verarbeiten // Hadoop-Ecosystem: Überblick über dessen Komponenten // Einführung in NoSQL // HBase installieren, einrichten & auf Daten zugreifen // Data-Warehousing mit Apache Hive // HiveQL als Abfragesprache, Hive Security, Hive & JDBC // Datenimport aus relationalen Datenbanken mit Sqoop // Big Data-Visualisierung: Diagrammarten, Tipps & Trends // Visualisierungs-Frameworks im Vergleich // D3.js: Entwicklung einiger Beispieldiagramme // Entwicklung einer abschließenden Big Data-Analyse-Lösung // Troubleshooting für die Arbeit mit Hadoop, Hive & HBase
Release

Wissensbewertung

Konzepte, Methoden und Anwendungsgebiete

Author: Katja Mang

Publisher: N.A

ISBN: 9783836409209

Category: Knowledge management

Page: 116

View: 3100

Release

Data Warehousing Strategie

Erfahrungen, Methoden, Visionen

Author: Reinhard Jung,Robert Winter

Publisher: Springer-Verlag

ISBN: 3642583504

Category: Business & Economics

Page: 284

View: 6227

Data Warehousing ist seit einigen Jahren in vielen Branchen ein zentrales Thema. Die anfängliche Euphorie täuschte jedoch darüber hinweg, dass zur praktischen Umsetzung gesicherte Methoden und Vorgehensmodelle fehlten. Dieses Buch stellt einen Beitrag zur Überwindung dieser Lücke zwischen Anspruch und Wirklichkeit dar. Es gibt im ersten Teil einen Überblick über aktuelle Ergebnisse im Bereich des Data Warehousing mit einem Fokus auf methodischen und betriebswirtschaftlichen Aspekten. Es finden sich u.a. Beiträge zur Wirtschaftlichkeitsanalyse, zur organisatorischen Einbettung des Data Warehousing, zum Datenqualitätsmanagement, zum integrierten Metadatenmanagement und zu datenschutzrechtlichen Aspekten sowie ein Beitrag zu möglichen zukünftigen Entwicklungsrichtungen des Data Warehousing. Im zweiten Teil berichten Projektleiter umfangreicher Data Warehousing-Projekte über Erfahrungen und Best Practices.
Release

Linux server hacks

Author: Rob Flickenger

Publisher: O'Reilly Verlag DE

ISBN: 9783897213616

Category: Client/server computing

Page: 246

View: 475

Release

Algorithmen für Dummies

Author: John Paul Mueller,Luca Massaron

Publisher: John Wiley & Sons

ISBN: 3527809775

Category: Computers

Page: 320

View: 8858

Wir leben in einer algorithmenbestimmten Welt. Deshalb lohnt es sich zu verstehen, wie Algorithmen arbeiten. Das Buch präsentiert die wichtigsten Anwendungsgebiete für Algorithmen: Optimierung, Sortiervorgänge, Graphentheorie, Textanalyse, Hashfunktionen. Zu jedem Algorithmus werden jeweils Hintergrundwissen und praktische Grundlagen vermittelt sowie Beispiele für aktuelle Anwendungen gegeben. Für interessierte Leser gibt es Umsetzungen in Python, sodass die Algorithmen auch verändert und die Auswirkungen der Veränderungen beobachtet werden können. Dieses Buch richtet sich an Menschen, die an Algorithmen interessiert sind, ohne eine Doktorarbeit zu dem Thema schreiben zu wollen. Wer es gelesen hat, versteht, wie wichtige Algorithmen arbeiten und wie man von dieser Arbeit beispielsweise bei der Entwicklung von Unternehmensstrategien profitieren kann.
Release

Eine Tour durch C++

Die kurze Einführung in den neuen Standrad C++11

Author: Bjarne Stroustrup

Publisher: Carl Hanser Verlag GmbH Co KG

ISBN: 3446439838

Category: Computers

Page: 200

View: 8199

EINE TOUR DURCH C++ // - Dieser Leitfaden will Ihnen weder das Programmieren beibringen noch versteht er sich als einzige Quelle, die Sie für die Beherrschung von C++ brauchen – aber diese Tour ist wahrscheinlich die kürzeste oder einfachste Einführung in C++11. - Für C- oder C++-Programmierer, die mit der aktuellen C++-Sprache vertrauter werden wollen - Programmierer, die in einer anderen Sprache versiert sind, erhalten ein genaues Bild vom Wesen und von den Vorzügen des modernen C++ . Mit dem C++11-Standard können Programmierer Ideen klarer, einfacher und direkter auszudrücken sowie schnelleren und effizienteren Code zu schreiben. Bjarne Stroustrup, der Designer und ursprüngliche Implementierer von C++, erläutert die Details dieser Sprache und ihre Verwendung in seiner umfassenden Referenz „Die C++-Programmiersprache“. In „Eine Tour durch C++“ führt Stroustrup jetzt die Übersichtskapitel aus der Referenz zusammen und erweitert sie so, dass auch erfahrene Programmierer in nur wenigen Stunden eine Vorstellung davon erhalten, was modernes C++ ausmacht. In diesem kompakten und eigenständigen Leitfaden behandelt Stroustrup – neben Grundlagen – die wichtigsten Sprachelemente und die wesentlichen Komponenten der Standardbibliothek. Er präsentiert die C++-Features im Kontext der Programmierstile, die sie unterstützen, wie die objektorientierte und generische Programmierung. Die Tour beginnt bei den Grundlagen und befasst sich dann mit komplexeren Themen, einschließlich vieler, die neu in C++11 sind wie z.B. Verschiebesemantik, einheitliche Initialisierung, Lambda-Ausdrücke, verbesserte Container, Zufallszahlen und Nebenläufigkeit. Am Ende werden Design und Entwicklung von C++ sowie die in C++11 hinzugekommenen Erweiterungen diskutiert. Programmierer erhalten hier – auch anhand von Schlüsselbeispielen – einen sinnvollen Überblick und praktische Hilfe für den Einstieg. AUS DEM INHALT // Die Grundlagen // Benutzerdefinierte Typen // Modularität // Klassen // Templates // Überblick über die Bibliothek // Strings und reguläre Ausdrücke // E/A-Streams // Container // Algorithmen // Utilities // Numerik // Nebenläufigkeit // Geschichte und Kompatibilität
Release

Organisation

Theorie, Design und Wandel

Author: Gareth R. Jones,Ricarda B. Bouncken

Publisher: Pearson Deutschland GmbH

ISBN: 9783827373014

Category: Management

Page: 976

View: 7761

Release

Brillante Denker, kühne Pioniere

zehn bahnbrechende Entdeckungen

Author: Philip Ball

Publisher: Wiley-VCH Verlag GmbH

ISBN: 9783527316809

Category: Chemistry

Page: 233

View: 8674

Zehn Experimente, die die Welt veränderten! Liegt ihre Schönheit in der Klarheit und Einfachkeit ihrer Konzeption? Oder im Entwickeln notwendiger Instrumente? Etwa in den resultierenden Produkten oder gar in der Kühnheit der bahnbrechenden Interpretation der Ergebnisse?
Release

Eclipse IDE kurz & gut

Author: Ed Burnette,Jörg Staudemeyer

Publisher: O'Reilly Media

ISBN: 3955611558

Category: Computers

Page: 176

View: 2732

Eclipse ist eine benutzerfreundliche, freie Entwicklungsumgebung (IDE), mit der die Anwendungsentwicklung dank vieler Werkzeuge zum Design, zum Modellieren und Testen vereinfacht wird. Dieser Band richtet sich an Java-Entwickler und gibt in knapper Form einen Überblick über zentrale Konzepte von Eclipse wie z.B. Views, Editoren und Perspektiven. Darüber hinaus wird erläutert, wie man Java-Code mit Hilfe von Tools wie Ant und JUnit integrieren kann. Das Buch bietet darüber hinaus Tipps und Tricks bei der Arbeit mit der IDE, ein Glossar Eclipse-typischer Begriffe sowie eine Auswahl nützlicher Plug-ins. Das Buch wurde für die dritte Auflage komplett überarbeitet und basiert auf der Version Eclipse 4.3.
Release