Apache Spark入門動かして学ぶ最新並列分散処理フレームワーク電子書籍（株式会社NTTデータ猿田浩輔土橋昌吉田耕陽佐々木徹都築正宜下垣徹）

Apache Spark入門動かして学ぶ最新並列分散処理フレームワーク

購入はこちら

Apache Sparkは多数のコンピュータを並列で動かして高速処理を実現する技術です。大量のデータを扱う「ビッグデータ」や「機械学習」、「IoT（Internet of Things：物のインターネット）」などの分野で応用が期待されるOSS（Open Source Software）です。

Apache SparkはUCバークレイで提唱されたRDD（Resilient Distributed Datasets）というアーキテクチャを採用しており、メモリを積極的に活用した分散並列処理を実現します。これにより、従来よりも大幅なパフォーマンスアップが期待できます。また、Hadoopとの高い親和性を有しており、YARNやHDFSなどのHadoopのシステムの枠組を使えます。

本書はApache Sparkを使うための知識を簡潔かつ実践的に紹介していきます。Apache Sparkでは「機械学習」「グラフ処理」「ストリーミング」処理等々を実現するためのライブラリが標準で利用できますが、各分野への応用も見据えたこれらの活用方法も本書で解説します。

Apache Sparkの仕組みとその利用方法を理解することにより、一歩先を行くデータ処理の新しい潮流を知ることができます。

※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

（翔泳社）

第1章：Apache Sparkとは
第2章：Sparkの処理モデル
第3章：Sparkの導入
第4章：Sparkアプリケーションの開発と実行
第5章：基本的なAPIを用いたプログラミング
第6章：構造化データセットを処理する - Spark SQL -
第7章：ストリームデータを処理する - Spark Streaming -
第8章：機械学習を行う - MLlib -
Appendix
A. GraphXによるグラフ処理
B. SparkRを使ってみる
C. 機械学習とストリーム処理の連携
D. Web UIの活用

付属データはこちら

書籍の購入や、商用利用・教育利用を検討されている法人のお客様はこちら

図書館での貸し出しに関するお問い合わせはよくあるお問い合わせをご確認ください。

利用許諾に関するお問い合わせ

本書の書影（表紙画像）をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影（表紙画像）以外のご利用については、こちらからお問い合わせください。

お問い合わせ

内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。

正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。

追加情報はありません。

この商品の「よくある質問」はありません。

正誤表の登録はありません。

Apache Spark入門動かして学ぶ最新並列分散処理フレームワーク

購入はこちら

利用許諾に関するお問い合わせ

お問い合わせ

感想・レビュー

おすすめ電子書籍

Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク

購入はこちら

利用許諾に関するお問い合わせ

お問い合わせ

感想・レビュー

おすすめ電子書籍

Apache Spark入門動かして学ぶ最新並列分散処理フレームワーク