そんな人はまず、以下の記事でビッグデータ分析の流れを学習することをおすすめします。
ビッグデータ分析の流れがわかったら、次に自分のやりたい分析に応じてソフトウェアの使い方を学びます。
ビッグデータ
ビッグデータ分析の学習を始める上でおすすめの書籍を紹介します。
オススメの学習順序は以下のとおりです。
※1 私は「ビッグデータ分析基盤の構築事例集 Hadoopクラスター構築実践ガイド」を読みましたが、世間一般では「Hadoop 第3版」の方が評価が高いのでこちらをオススメさせていただきました。
ビッグデータを支える技術 ——ラップトップ1台で学ぶデータ基盤のしくみ WEB+DB PRESS plus
- わかりやすさ:★★★★☆
- google 検索で探しにくい情報:★★★★★
- 分野全体の網羅度:★★★★★
- 総合おすすめ度:★★★★★
ビッグデータを分析するための基盤側の技術に焦点を当てて解説した本となります。
初めてビッグデータのアーキテクチャを構築する際に、全体を俯瞰できる良書です。
また、ビッグデータ分析をする上で「なぜこの基盤が必要なんだ?」ということがよくあるのですが、その疑問にも答えてくれています。
Hadoop 第3版
実際に読んだこと無いので評価できませんが、Hadoop 入門書の定番のようです。
情報が少し古いようですが、Hadoop を網羅的に学ぶには非常に役に立つようです。
Elasticsearch実践ガイド
- わかりやすさ:★★★★★
- google 検索で探しにくい情報:★★★☆☆
- 分野全体の網羅度:★★★★★
- 総合おすすめ度:★★★★★
Elasticsearch の右も左もわからない状態の場合、この書籍から入ることをオススメします。とんでもなくわかりやすいです。また、かなり網羅度が高く、この本を読み終わる頃には、公式ドキュメントと合わせれば自分でなんでもできるようになっているでしょう。
Kafka
- わかりやすさ:★★★★☆
- google 検索で探しにくい情報:★★★★☆
- 分野全体の網羅度:★★★★★
- 総合おすすめ度:★★★★★
ストリーム処理という概念自体がググっても、まともな日本語記事が無かったために本書を購入しました。本書籍は Apache Kafka を作成した LinkedIn のエンジニアによって執筆されています。そのため、実体験を元にストリーム処理が必要となった経緯を説明してくれるため、納得感が段違いです。
この本を読んだ上で、最新の公式ドキュメントを見ながら開発するのがオススメです。