Tiago Rodrigues Antão 原著
株式会社クイープ 監修
株式会社クイープ 翻訳
Pythonでデータセットを扱う際、最後に重要になってくるのはやはり「処理速度」です。データが巨大であればあるほど、ちょっとした工夫が処理速度を向上させ、「データの氾濫」ともいえる現状を打開する鍵になってくれます。
Pythonの特性を理解しつつそのパフォーマンスを最大限に引き出し、さらにハイパフォーマンスなライブラリを正しく利用することができれば、遅い遅いといわれがちなPythonにおいても、爆速な処理を手にすることができるのです。
本書は、組み込み機能やスレッディング特性、CPythonのグローバルインタプリタロック(GIL)などに始まり、Cythonへの移行やGPUの利用に至るまでの多面的なアプローチを紹介し、単にマシン性能を上げたり、マシンの数を増やすだけでは得られない、効率的なPythonアプリケーションの記述をサポートします。
【本書は『Fast Python: High performance techniques for large datasets』の邦訳書です。】
◆◆◆◆◆もくじ◆◆◆◆◆
●Part 1 基礎的なアプローチ
・Chapter 1 データ処理の効率化が急がれている
・Chapter 2 組み込み機能のパフォーマンスを最大限に引き出す
・Chapter 3 並行性、並列性、非同期処理
・Chapter 4 ハイパフォーマンスなNumPy
●Part 2 ハードウェア
・Chapter 5 Cythonを使って重要なコードを再実装する
・Chapter 6 メモリ階層、ストレージ、ネットワーク
●Part 3 現代のデータ処理のためのアプリケーションとライブラリ
・Chapter 7 ハイパフォーマンスなpandasとApache Arrow
・Chapter 8 ビッグデータの格納
●Part 4 高度なトピック
・Chapter 9 GPUコンピューティングを使ったデータ分析
・Chapter 10 Daskを使ったビッグデータの分析
・付録A 環境のセットアップ
・付録B Numbaを使って効率的な低レベルコードを生成する
●Part 1 基礎的なアプローチ
・Chapter 1 データ処理の効率化が急がれている
・Chapter 2 組み込み機能のパフォーマンスを最大限に引き出す
・Chapter 3 並行性、並列性、非同期処理
・Chapter 4 ハイパフォーマンスなNumPy
●Part 2 ハードウェア
・Chapter 5 Cythonを使って重要なコードを再実装する
・Chapter 6 メモリ階層、ストレージ、ネットワーク
●Part 3 現代のデータ処理のためのアプリケーションとライブラリ
・Chapter 7 ハイパフォーマンスなpandasとApache Arrow
・Chapter 8 ビッグデータの格納
●Part 4 高度なトピック
・Chapter 9 GPUコンピューティングを使ったデータ分析
・Chapter 10 Daskを使ったビッグデータの分析
・付録A 環境のセットアップ
・付録B Numbaを使って効率的な低レベルコードを生成する
内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。
正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。
本書の書影(表紙画像)をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影(表紙画像)以外のご利用については、こちらからお問い合わせください。
刷数は奥付(書籍の最終ページ)に記載されています。
書籍の種類:
書籍の刷数:
本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。
対象の書籍は正誤表がありません。
発生刷 | ページ数 | 書籍改訂刷 | 電子書籍訂正 | 内容 | 登録日 | ||||
---|---|---|---|---|---|---|---|---|---|
1刷 | 098 リスト直後の本文 |
2刷 | 未 |
|
2024.08.02 | ||||
1刷 | 099 本文最初の段落 |
2刷 | 未 |
|
2024.08.02 | ||||
1刷 | 099 本文2つ目の段落 |
2刷 | 未 |
|
2024.08.02 | ||||
1刷 | 100 図4-6中、「どう見えるか」の内容 |
2刷 | 未 |
|
2024.08.02 |