ほげてく | ページ 22 | ほげほげテクノロジー

【入門】Apache Hive とは？メタストアや HiveServer を解説

Apache Hive Apache Hive とは、分散ストレージ（Hadoop など）のデータセットに対して、SQL クエリで「読み取り・書き込み・管理」するソフトウェアです。最初に本記事は、以下のビッグデータ分析基盤シリーズの「スト...

2020.08.25

Apacheビッグデータ分析

ビッグデータ分析

初めに本記事は、以下のビッグデータ分析基盤シリーズの Apache Spark 編です。【ビッグデータ入門１】ビッグデータ分析基盤【ビッグデータ入門２】ストリーム処理【ビッグデータ入門３】fluentd【ビッグデータ入門４】Elastics...

2020.08.24

Apacheビッグデータ分析

fluentd (td-agent) fluentd (td-agent) とは、ログ収集ソフトウェアです。アプリケーションや各 IoT 機器のログを１箇所に集約するために利用します。初めに本記事は、以下のビッグデータ分析基盤シリーズの f...

2021.01.09

OSSビッグデータ分析

ビッグデータの分析基盤、機械学習を導入するにあたり、「ストリーム処理」という言葉をよく目にするようになりました。一方で「ストリーム処理」に関する説明が抽象的でイメージが掴みにくいのが実情です。そこで今回は以下の項目について「ストリーム処理」...

2020.12.19

ビッグデータ分析

Apache Hadoop Apache Hadoop とは、並列分散処理を実現するミドルウェアです。「ビッグデータを１台のコンピュータで処理すると時間がかかりすぎるため、コンピューターをいっぱい並べて高速に処理しよう。」というのが Had...

2020.09.05

Apacheビッグデータ分析