ビッグデータ分析Apache Spark とは【入門】 初めに 本記事は、以下のビッグデータ分析基盤シリーズの Apache Spark 編です。 【ビッグデータ入門1】ビッグデータ分析基盤【ビッグデータ入門2】ストリーム処理【ビッグデータ入門3】fluentd【ビッグデータ入門4... 2020.08.24Apacheビッグデータ分析
ビッグデータ分析【入門】fluentd (td-agent) とは?インストールと使い方 fluentd (td-agent) fluentd (td-agent) とは、ログ収集ソフトウェアです。 アプリケーションや各 IoT 機器のログを1箇所に集約するために利用します。 初めに ... 2021.01.09OSSビッグデータ分析
ビッグデータ分析【入門】ストリーム処理とは? OSS のエンジンを紹介 ビッグデータの分析基盤、機械学習を導入するにあたり、「ストリーム処理」という言葉をよく目にするようになりました。 一方で「ストリーム処理」に関する説明が抽象的でイメージが掴みにくいのが実情です。 そこで今回は以下の項目について... 2020.12.19ビッグデータ分析
ビッグデータ分析【入門】ビッグデータ分析基盤とは?データパイプラインを構築 ビッグデータ ビッグデータとは、通常のソフトウェアでは処理できないほどの大規模な (テラバイト、ペタバイト、エクサバイト規模の) データのことです。 本記事では、ビッグデータを以下のように可視化、分析することをゴ... 2020.08.27ビッグデータ分析
ビッグデータ分析【入門】Hadoop とは?MapReduce の使い方やエコシステム一覧 Apache Hadoop Apache Hadoop とは、並列分散処理を実現するミドルウェアです。 「ビッグデータを1台のコンピュータで処理すると時間がかかりすぎるため、コンピューターをいっぱい並べて高速に処... 2020.09.05Apacheビッグデータ分析