Apache

【入門】Apache Kafka とは？docker で起動から使い方までを解説

Apache Kafka を学習する上で以下のような疑問が生まれたため、本記事にまとめました。どんなことができるの？分散ストリーミング処理システムって何？そもそも何に使うのこれ？メッセージキューイングシステムでよくない？どうやって使うの？初...

2020.11.07

Apacheビッグデータ分析

Apache Hive Apache Hive とは、分散ストレージ（Hadoop など）のデータセットに対して、SQL クエリで「読み取り・書き込み・管理」するソフトウェアです。最初に本記事は、以下のビッグデータ分析基盤シリーズの「スト...

2020.08.25

Apacheビッグデータ分析

ビッグデータ分析

初めに本記事は、以下のビッグデータ分析基盤シリーズの Apache Spark 編です。【ビッグデータ入門１】ビッグデータ分析基盤【ビッグデータ入門２】ストリーム処理【ビッグデータ入門３】fluentd【ビッグデータ入門４】Elastics...

2020.08.24

Apacheビッグデータ分析

ビッグデータ分析

Apache Hadoop Apache Hadoop とは、並列分散処理を実現するミドルウェアです。「ビッグデータを１台のコンピュータで処理すると時間がかかりすぎるため、コンピューターをいっぱい並べて高速に処理しよう。」というのが Had...

2020.09.05

Apacheビッグデータ分析