ビッグデータ分析の勉強をやろうと思ったけど、どこから勉強すればいいの?
という方のために、学習ロードマップを用意しました。
記事の一覧
そもそもビッグデータ分析とは?
【入門】ビッグデータ分析基盤とは?データパイプラインを構築
ビッグデータ ビッグデータとは、通常のソフトウェアでは処理できないほどの大規模な (テラバイト、ペタバイト、エクサバイト規模の) データのことです。本記事では、ビッグデータを以下のように可視化、分析することをゴ...
ストリーム処理とは?
【入門】ストリーム処理とは? OSS のエンジンを紹介
ビッグデータの分析基盤、機械学習を導入するにあたり、「ストリーム処理」という言葉をよく目にするようになりました。一方で「ストリーム処理」に関する説明が抽象的でイメージが掴みにくいのが実情です。そこで今回は以下の項目について...
データ分析 | |||
---|---|---|---|
おすすめの書籍
ビッグデータ分析の学習に役立つ書籍を、おすすめの学習順で紹介します。
ビッグデータを支える技術 ——ラップトップ1台で学ぶデータ基盤のしくみ WEB+DB PRESS plus
- わかりやすさ:★★★★☆
- google 検索で探しにくい情報:★★★★★
- 分野全体の網羅度:★★★★★
- 総合おすすめ度:★★★★★
ビッグデータを分析するための基盤側の技術に焦点を当てて解説した本となります。
初めてビッグデータのアーキテクチャを構築する際に、全体を俯瞰できる良書です。
また、ビッグデータ分析をする上で「なぜこの基盤が必要なんだ?」ということがよくあるのですが、その疑問にも答えてくれています。
Kafka
- わかりやすさ:★★★★☆
- google 検索で探しにくい情報:★★★★☆
- 分野全体の網羅度:★★★★★
- 総合おすすめ度:★★★★★
ストリーム処理という概念自体がググっても、まともな日本語記事が無かったために本書を購入しました。本書籍は Apache Kafka を作成した LinkedIn のエンジニアによって執筆されています。そのため、実体験を元にストリーム処理が必要となった経緯を説明してくれるため、納得感が段違いです。
この本を読んだ上で、最新の公式ドキュメントを見ながら開発するのがオススメです。
Elasticsearch実践ガイド
- わかりやすさ:★★★★★
- google 検索で探しにくい情報:★★★☆☆
- 分野全体の網羅度:★★★★★
- 総合おすすめ度:★★★★★
Elasticsearch の右も左もわからない状態の場合、この書籍から入ることをオススメします。とんでもなくわかりやすいです。また、かなり網羅度が高く、この本を読み終わる頃には、公式ドキュメントと合わせれば自分でなんでもできるようになっているでしょう。