ビッグデータ分析 【入門】ビッグデータ分析基盤とは?データパイプラインを構築 ビッグデータ ビッグデータとは、通常のソフトウェアでは処理できないほどの大規模な (テラバイト、ペタバイト、エクサバイト規模の) データのことです。本記事では、ビッグデータを以下のように可視化、分析することをゴールとします。ビッグデータがス... 2020.08.27 ビッグデータ分析
ビッグデータ分析 【入門】Apache Hive とは?メタストアや HiveServer を解説 Apache Hive Apache Hive とは、分散ストレージ(Hadoop など) のデータセットに対して、SQL クエリで「読み取り・書き込み・管理」するソフトウェアです。最初に本記事は、以下のビッグデータ分析基盤シリーズの「スト... 2020.08.25 Apacheビッグデータ分析