ビッグデータ分析

【入門】ビッグデータ分析基盤とは？データパイプラインを構築

ビッグデータビッグデータとは、通常のソフトウェアでは処理できないほどの大規模な (テラバイト、ペタバイト、エクサバイト規模の) データのことです。本記事では、ビッグデータを以下のように可視化、分析することをゴールとします。ビッグデータがス...

2020.08.27

ビッグデータ分析

Grafana Grafana とは、データソースの可視化やアラートの設定をする OSS です。Grafana はデータソースにクエリを渡すことで、可視化するデータを取得します。利用可能なデータソースの一例は、以下のとおりです。Promet...

2022.05.05

コンテナビッグデータ分析

Apache Hive Apache Hive とは、分散ストレージ（Hadoop など）のデータセットに対して、SQL クエリで「読み取り・書き込み・管理」するソフトウェアです。最初に本記事は、以下のビッグデータ分析基盤シリーズの「スト...

2020.08.25

Apacheビッグデータ分析

ビッグデータ分析

初めに本記事は、以下のビッグデータ分析基盤シリーズの Apache Spark 編です。【ビッグデータ入門１】ビッグデータ分析基盤【ビッグデータ入門２】ストリーム処理【ビッグデータ入門３】fluentd【ビッグデータ入門４】Elastics...

2020.08.24

Apacheビッグデータ分析

fluentd (td-agent) fluentd (td-agent) とは、ログ収集ソフトウェアです。アプリケーションや各 IoT 機器のログを１箇所に集約するために利用します。初めに本記事は、以下のビッグデータ分析基盤シリーズの f...

2021.01.09

OSSビッグデータ分析