ビッグデータ分析の学習ロードマップ

BI

【入門】Grafana とは?構築や設定方法を説明

Grafana Grafana とは、データソースの可視化やアラートの設定をする OSS です。 Grafana はデータソースにクエリを渡すことで、可視化するデータを取得します。 利用可能なデータ...
ビッグデータ分析基盤

【入門】Apache Hive とは?メタストアや HiveServer を解説

Apache Hive Apache Hive とは、分散ストレージ(Hadoop など) のデータセットに対して、SQL クエリで「読み取り・書き込み・管理」するソフトウェアです。 最初に 本記事は、以下...
ビッグデータ分析基盤

【入門】Apache Kafka とは?docker で起動から使い方までを解説

Apache Kafka を学習する上で以下のような疑問が生まれたため、本記事にまとめました。 どんなことができるの?分散ストリーミング処理システムって何?そもそも何に使うのこれ?メッセージキューイングシステムでよくない?どうやって...
ビッグデータ分析基盤

Apache Spark とは【入門】

初めに 本記事は、以下のビッグデータ分析基盤シリーズの Apache Spark 編です。 【ビッグデータ入門1】ビッグデータ分析基盤【ビッグデータ入門2】ストリーム処理【ビッグデータ入門3】fluentd【ビッグデータ入門4...
ビッグデータ分析基盤

【入門】fluentd (td-agent) とは?インストールと使い方

fluentd (td-agent) fluentd (td-agent) とは、ログ収集ソフトウェアです。 アプリケーションや各 IoT 機器のログを1箇所に集約するために利用します。 初めに ...