Pythonによるクローラー&スクレイピング入門 設計・開発から収集データの解析・運用まで(加藤 勝也 横山 裕季)|翔泳社の本
  1. ホーム >
  2. 書籍 >
  3. Pythonによるクローラー&スクレイピング入門 設計・開発から収集データの解析・運用まで

Pythonによるクローラー&スクレイピング入門 設計・開発から収集データの解析・運用まで



形式:
書籍
発売日:
ISBN:
9784798149127
定価:
3,300(本体3,000円+税10%)
仕様:
B5変・432ページ
カテゴリ:
プログラミング・開発
キーワード:
#プログラミング,#開発環境,#開発手法,#Web・アプリ開発
紙の書籍

Webデータの巡回収集と解析を
すべて自動で処理しよう

【背景】
企業においてデータ分析の需要が多くなってきているなか、
企業のデータ分析の現場において、
Webから様々なデータを集める「クローラー(クローリング)」と
集めたデータの解析を行う「スクレイピング」のニーズが
非常に高まってきています。

【対象読者】
・データの収集、解析などの仕事を請け負うプログラマー
・クローラー開発を請け負うエンジニア

【本書の特徴】
本書は、データ収集・解析などの仕事を請け負うプログラマーや、
クローラー開発を請け負う分析会社のエンジニアに向けて、
クローラーの開発手法から実際のクローリングおよび
スクレイピング手法ついて解説した入門書です。

本書ではデータ分析の現場でニーズの高まってきているPythonを利用して、
クローラー開発から始まり、クローリング、スクレイピングの基本から応用手法、
そして運用までそれぞれの開発が直面する場面に沿って丁寧に解説します。
最終章では目的別のクローラー開発手法を解説しています。

【対象OSとPythonのバージョンについて】
・OS:macOS Sierra(10.2.x)
・Python:3.6.2

【目次】
Part1 基本編

Chapter 1 クローラーとスクレイピングを体験する
Chapter 2 クローラーを設計する
Chapter 3 クローラーおよびスクレイピングの開発環境の準備とPythonの基本 
Chapter 4 スクレイピングの基本

Part2 応用編

Chapter 5 クローラーの設計・開発(応用編)
Chapter 6 スクレイピングの開発(応用編)
Chapter 7 クローラーで集めたデータを利用する
Chapter 8 クローラーの保守・運用
Chapter 9 目的別クローラー&スクレイピング開発手法

Appendix クローラー&スクレイピングに役立つライブラリ

Part1 基本編

Chapter 1 クローラーとスクレイピングを体験する
Chapter 2 クローラーを設計する
Chapter 3 クローラーおよびスクレイピングの開発環境の準備とPythonの基本
Chapter 4 スクレイピングの基本

Part2 応用編

Chapter 5 クローラーの設計・開発(応用編)
Chapter 6 スクレイピングの開発(応用編)
Chapter 7 クローラーで集めたデータを利用する
Chapter 8 クローラーの保守・運用
Chapter 9 目的別クローラー&スクレイピング開発手法

Appendix クローラー&スクレイピングに役立つライブラリ

付属データはこちら

会員特典はこちら

お問い合わせ

内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。

正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。

利用許諾に関するお問い合わせ

本書の書影(表紙画像)をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影(表紙画像)以外のご利用については、こちらからお問い合わせください。

  • ライブラリのバージョン情報

     本書でインストールされる追加ライブラリのバージョンは下表のとおりです(本書執筆時点のもの)。
     pipコマンドにおけるインストール時のバージョン指定は以下の通りです。


    pip install ライブラリ名==バージョン番号 (複数の場合はスペース連結)


  • Qitaのhttps化に伴うアドレスの変更

    ・実行コマンドの2行目(httpsになります)

    【変更前】
    $ curl 'http://qiita.com/api/v2/items?page=1&per_page=20' | jq .


    【変更後】
    $ curl 'https://qiita.com/api/v2/items?page=1&per_page=20' | jq .
この商品の「よくある質問」はありません。

ご購入いただいた書籍の種類を選択してください。

書籍の刷数を選択してください。

刷数は奥付(書籍の最終ページ)に記載されています。

現在表示されている正誤表の対象書籍

書籍の種類:

書籍の刷数:

本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。

対象の書籍は正誤表がありません。

最終更新日:2018年04月24日
発生刷 ページ数 書籍改訂刷 電子書籍訂正 内容 登録日
1刷 041
下から4行目
2刷
「独自クローラーを開発しなければいけない」
「独自クローラーを開発してはいけない」
2018.04.24
1刷 062
下から1行目
2刷
charset=utf8mb
charset=utf8mb4
2018.04.24

感想・レビュー

坂田 哲朗 さん

2017-10-30

章立てのバランスが良いと感じました。深掘りは少ないですが、全体が俯瞰できてありがたいです。ツールの選択や開発手法について、今までやってきたことの方向性に大きな間違いは無いことがわかって少し安心しました。Web API を作るのであればなにもフルスタックのDjangoでなくともFlaskでいいのか。予算が無いのでエンジニアとしてはフルスタックを目指さなければならないのだけれど。

Teruhisa Fukumoto さん

2018-05-06

Gunosyのエンジニアによる実践に基づいたクローラ&スクレイピングの技術良書。最初はwgetなどの基本的なツールの使い方から、はてなやTumblrのAPIを使って投稿を引っ張ってSlackやメールに通知する、みたいな読者が興味を持ちそうな話をしてくれ、実際のシステムの運用における注意まで記載があるなど、tipsが大量にあって素晴らしい。