森 巧尚 著
【本書の背景】
機械学習やデータ分析になくてはならない「データ」。このようなデータはインターネット上に膨大にありますが、Pythonを使えば効率よくデータ収集できます。こうした手法を「スクレイピング」といいます。サイト自体もオープンデータ化が進んでおり、データを集めやすい環境が整ってきています。
【本書の概要】
ヤギ博士&フタバちゃんと一緒に、インターネットからのファイルのダウンロード方法やHTMLの解析方法、いろいろなデータの読み書きの方法、APIを使ったデータ収集方法を解説します。さらにライブラリを利用したデータの見える化の方法も解説します。
【第2版のポイント】
・Python 3.12対応
・各種ライブラリのアップデート
・利用オープンデータなどのアップデート
【Python2年生について】
「Python2年生」シリーズは「Python1年生」を読み終えた方を対象とした入門書です。ある程度、技術的なことを盛り込んでいますので、スキルアップにつながります。
【対象読者】
・ネット上からデータ収集を行う初心者
・データ分析の手前の初心者
【本書のポイント】
・対話形式で解説し、イラストを交えながら基礎知識を解説します。
・平易なサンプルを用意していますので、安心してプログラムを体験できます。
【目次】
第1章 Pythonでデータをダウンロード
第2章 HTMLを解析しよう
第3章 表データを読み書きしよう
第4章 オープンデータを分析してみよう
第5章 Web APIでデータを収集しよう
【著者プロフィール】
森 巧尚(もり・よしなお)
『マイコンBASICマガジン』(電波新聞社)の時代からゲームを作り続けて、現在はコンテンツ制作や執筆活動を行い、関西学院大学非常勤講師、関西学院高等部非常勤講師、成安造形大学非常勤講師、大阪芸術大学非常勤講師、プログラミングスクールコプリ講師などを行っている。近著に『ChatGPTプログラミング1年生』、『Python3年生 ディープラーニングのしくみ』、『Python2年生 デスクトップアプリ開発のしくみ』、『Python1年生 第2版』、『Python3年生 機械学習のしくみ』、『Python2年生 データ分析のしくみ』、『Java1年生』(いずれも翔泳社)、『ゲーム作りで楽しく学ぶ オブジェクト指向のきほん』(マイナビ出版)などがある。
章の冒頭には漫画やイラストを入れて該当する章で学ぶことに触れています。冒頭以降は、イラストを織り交ぜつつ、スクレイピングの基礎知識について説明しています。
スクレイピングに必要な最低限の文法をピックアップして解説しています。途中で学習がつまずかないよう、会話を主体にして、わかりやすく解説しています。
初めてスクレイピングを学ぶ方が楽しく学習できるように工夫したサンプルを用意しています。
第1章 Pythonでデータをダウンロード
LESSON 01 スクレイピングってなに?
LESSON 02 Pythonをインストールしてみよう
LESSON 03 requestsでアクセスしてみよう
第2章 HTMLを解析しよう
LESSON 04 HTMLを解析してみよう
LESSON 05 青空文庫の作品を取得してみよう
LESSON 06 リンク一覧をファイルに書き出そう
LESSON 07 画像を一括ダウンロードしよう
第3章 表データを読み書きしよう
LESSON 08 pandasを使ってみよう
LESSON 09 さまざまなデータの加工
LESSON 10 グラフで表示してみよう
LESSON 11 Excelファイルを読み書きしてみよう
第4章 オープンデータを分析してみよう
LESSON 12 オープンデータってなに?
LESSON 13 郵便局:郵便番号データ
LESSON 14 e-Stat:政府統計の相互窓口
LESSON 15 キッズすたっと:探そう統計データ
LESSON 16 自治体のデータ:データシティ鯖江
第5章 Web APIでデータを収集しよう
LESSON 17 Web APIってなに?
LESSON 18 OpenWeatherMapってなに?
LESSON 19 現在の天気を調べよう
LESSON 20 現在から5日間(3時間ごと)の天気を調べよう
内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。
正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。
本書の書影(表紙画像)をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影(表紙画像)以外のご利用については、こちらからお問い合わせください。