ビッグデータ分析基盤【入門】Apache Kafka とは?docker で起動から使い方までを解説 Apache Kafka を学習する上で以下のような疑問が生まれたため、本記事にまとめました。 どんなことができるの?分散ストリーミング処理システムって何?そもそも何に使うのこれ?メッセージキューイングシステムでよくない?どうやって... 2020.11.07Apacheビッグデータ分析基盤
ビッグデータ分析基盤Apache Spark とは【入門】 初めに 本記事は、以下のビッグデータ分析基盤シリーズの Apache Spark 編です。 【ビッグデータ入門1】ビッグデータ分析基盤【ビッグデータ入門2】ストリーム処理【ビッグデータ入門3】fluentd【ビッグデータ入門4... 2020.08.24Apacheビッグデータ分析基盤
ビッグデータ分析基盤【入門】fluentd (td-agent) とは?インストールと使い方 fluentd (td-agent) fluentd (td-agent) とは、ログ収集ソフトウェアです。 アプリケーションや各 IoT 機器のログを1箇所に集約するために利用します。 初めに ... 2021.01.09OSSビッグデータ分析基盤
ビッグデータ分析基盤【入門】Hadoop とは?MapReduce の使い方やエコシステム一覧 Apache Hadoop Apache Hadoop とは、並列分散処理を実現するミドルウェアです。 「ビッグデータを1台のコンピュータで処理すると時間がかかりすぎるため、コンピューターをいっぱい並べて高速に処... 2020.09.05Apacheビッグデータ分析基盤
ツール【入門】Jupyter Notebook とは?操作方法を解説 Jupyter Notebook Jupyter Notebook とは、ブラウザで1行ごとにコードを実行したり、メモ帳として使える OSS です。 Jupyter Notebook の例 The Jupy... 2022.05.14OSSツール