森 巧尚 著
【スクレイピングとは】
機械学習やデータ分析になくてはならない「データ」。
このようなデータは、インターネット上に膨大にありますが、Pythonを使えば効率よくデータ収集できます。
こうした手法を「スクレイピング」といいます。
サイト自体もオープンデータ化が進んでおり、データを集めやすい環境が整ってきています。
【Python2年生について】
「Python2年生」シリーズは、「Python1年生」を読み終えた方を対象とした入門書です。
ある程度、技術的なことを盛り込み、本書で扱う技術について身に着けてもらいます。
【ターゲット】
・ネット上からデータ収集を行う初心者
・データ分析の手前の初心者
【本書の売り】
ヤギ博士&フタバちゃんと一緒に、インターネットからのファイルのダウンロード方法、
HTML解析の方法、いろいろなデータの読み書き、
APIの使い方といったデータ収集と便利なライブラリを利用した簡単な可視化手法を解説する書籍です。
また最終的にデータ収集を自動化する方法も簡単に解説します。
章の冒頭には漫画やイラストを入れて各章で学ぶことに触れています。冒頭以降は、イラストを織り交ぜつつ、基礎知識について説明しています。
必要最低限の文法をピックアップして解説しています。途中で学習がつまずかないよう、会話を主体にして、わかりやすく解説しています。
初めてプログラミング言語(アプリケーション)を学ぶ方に向けて、楽しく学習できるよう工夫したサンプルを用意しています。
第1章 Pythonでデータをダウンロード
LESSON 01 スクレイピングってなに?
LESSON 02 Pythonをインストールしてみよう
LESSON 03 requestsでアクセスしてみよう
第2章 HTMLを解析しよう
LESSON 04 HTMLを解析してみよう
LESSON 05 ニュースの最新記事一覧を取得してみよう
LESSON 06 リンク一覧をファイルに書き出そう
LESSON 07 画像を一括ダウンロードしよう
第3章 表データを読み書きしよう
LESSON 08 pandasを使ってみよう
LESSON 09 さまざまなデータの加工
LESSON 10 グラフで表示してみよう
LESSON 11 Excelファイルを読み書きしてみよう
第4章 オープンデータを分析してみよう
LESSON 12 オープンデータってなに?
LESSON 13 郵便局:郵便番号データ
LESSON 14 e-Stat:政府統計の相互窓口
LESSON 15 キッズすたっと:探そう統計データ
LESSON 16 自治体のデータ:データシティ鯖江
第5章 Web APIでデータを収集しよう
LESSON 17 Web APIってなに?
LESSON 18 OpenWeatherMapってなに?
LESSON 19 現在の天気を調べよう
LESSON 20 現在から5日間(3時間ごと)の天気を調べよう
内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。
正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。
本書の書影(表紙画像)をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影(表紙画像)以外のご利用については、こちらからお問い合わせください。
刷数は奥付(書籍の最終ページ)に記載されています。
書籍の種類:
書籍の刷数:
本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。
対象の書籍は正誤表がありません。
ぶうやそ さん
2021-02-23
web上には膨大な情報が公開されており、その気になれば幾らでも集めることができる。特にスクレイピングができるようになれば、自分の思い通りにデータ収集が可能となり、マーケティングという領域において強力な武器となる。本書ではPythonを使用したwebスクレイピングの他にも、pandasでの表データの扱い方、matplotlibでの可視化などにも触れられており、データ収集から活用まで幅広く学ぶ事ができる。最近、私の周りでもPython学習者が増加中。機械学習、作業自動化などにも使え、コスパの良いスキルである。
こもも さん
2021-09-21
python1年生に続き、2年生のスクレイピングのしくみも手を動かしながらチャレンジしてみました。最後のヤギ先生の言葉通り、 この本で出来る様になるのは「道具の使い方」であって、世の中にあるデータをどう扱って、 どう分析するかは各々考えなきゃいけないですね。まずは手に入る材料で、もっと分析の練習をしたいと思います。
goose さん
2020-03-01
さくさく読める。自分のレベルには最適でした。