ビッグデータ分析の学習ロードマップ

ビッグデータ分析の勉強をやろうと思ったけど、どこから勉強すればいいの?

という方のために、学習ロードマップを用意しました。

記事の一覧

そもそもビッグデータ分析とは?

【入門】ビッグデータ分析基盤とは?データパイプラインを構築
ビッグデータ ビッグデータとは、通常のソフトウェアでは処理できないほどの大規模な (テラバイト、ペタバイト、エクサバイト規模の) データのことです。本記事では、ビッグデータを以下のように可視化、分析することをゴ...

ストリーム処理とは?

【入門】ストリーム処理とは? OSS のエンジンを紹介
ビッグデータの分析基盤、機械学習を導入するにあたり、「ストリーム処理」という言葉をよく目にするようになりました。一方で「ストリーム処理」に関する説明が抽象的でイメージが掴みにくいのが実情です。そこで今回は以下の項目について...
データ分析

おすすめの書籍

ビッグデータ分析の学習に役立つ書籍を、おすすめの学習順で紹介します。

  1. ビッグデータを支える技術 (ビッグデータ分析の用語)
  2. Kafka (データ収集)
  3. Elasticsearch実践ガイド (データ分析)

ビッグデータを支える技術 ——ラップトップ1台で学ぶデータ基盤のしくみ WEB+DB PRESS plus


  • わかりやすさ:★★★★☆
  • google 検索で探しにくい情報:★★★★★
  • 分野全体の網羅度:★★★★★
  • 総合おすすめ度:★★★★★

ビッグデータを分析するための基盤側の技術に焦点を当てて解説した本となります。

初めてビッグデータのアーキテクチャを構築する際に、全体を俯瞰できる良書です。

また、ビッグデータ分析をする上で「なぜこの基盤が必要なんだ?」ということがよくあるのですが、その疑問にも答えてくれています。

Kafka

  • わかりやすさ:★★★★☆
  • google 検索で探しにくい情報:★★★★☆
  • 分野全体の網羅度:★★★★★
  • 総合おすすめ度:★★★★★

ストリーム処理という概念自体がググっても、まともな日本語記事が無かったために本書を購入しました。本書籍は Apache Kafka を作成した LinkedIn のエンジニアによって執筆されています。そのため、実体験を元にストリーム処理が必要となった経緯を説明してくれるため、納得感が段違いです。

この本を読んだ上で、最新の公式ドキュメントを見ながら開発するのがオススメです。

Elasticsearch実践ガイド


  • わかりやすさ:★★★★★
  • google 検索で探しにくい情報:★★★☆☆
  • 分野全体の網羅度:★★★★★
  • 総合おすすめ度:★★★★★

Elasticsearch の右も左もわからない状態の場合、この書籍から入ることをオススメします。とんでもなくわかりやすいです。また、かなり網羅度が高く、この本を読み終わる頃には、公式ドキュメントと合わせれば自分でなんでもできるようになっているでしょう。

ビッグデータ分析記事一覧


OSS

【入門】Elasticsearch とは?わかりやすく解説

Elasticsearch Elasticsearch とは、複数のファイルから特定の文字列を分散検索するソフトウェアです。 具体的には google 検索や、github のソースコード検索のような全文検索 (...
OSS

【Elasticsearch 入門4】集計・分類 (Aggregations)

本記事は Elasticsearch 入門記事の第4回「集計・分類 (Aggregations)」です。 その他の Elasticsearch の使い方は以下の記事をご覧ください。 集計...
OSS

【Elasticsearch 入門5】Dynamic index settings の変更

本記事は Elasticsearch 入門記事の第5回「Dynamic index settings の変更」です。 その他の Elasticsearch の使い方は以下の記事をご覧ください。 ...
OSS

【Elasticsearch 入門2】マッピングとテンプレートの設定/確認

本記事は Elasticsearch 入門記事の第2回「マッピング管理とテンプレート」です。 その他の Elasticsearch の使い方は以下の記事をご覧ください。 【Elasticsearch 入門1】Elastics...
OSS

【Elasticsearch 入門3】Analyzer の設定と日本語の全部検索

本記事は Elasticsearch 入門記事の第3回「Analyzer の設定」です。 その他の Elasticsearch の使い方は以下の記事をご覧ください。 Analyzer と...