Pythonによるあたらしいデータ分析の教科書 第2版(寺田 学 辻 真吾 鈴木 たかのり 福島 真太朗)|翔泳社の本
  1. ホーム >
  2. 書籍 >
  3. Pythonによるあたらしいデータ分析の教科書 第2版

Pythonによるあたらしいデータ分析の教科書 第2版





形式:
書籍
発売日:
ISBN:
9784798176611
定価:
2,838(本体2,580円+税10%)
仕様:
A5・336ページ
カテゴリ:
プログラミング・開発
キーワード:
#プログラミング,#開発環境,#開発手法,#Web・アプリ開発
シリーズ:
AI & TECHNOLOGY
紙の書籍

読者の声に応えて第2版の登場!
データ分析エンジニアに必要な
基本技術をしっかり習得できる

【本書の概要】
本書はデータ分析エンジニアに必要な
以下の基礎技術を丁寧に解説しています。

・データの取得・加工
・データの可視化
・プログラミング
・基礎的な数学の知識
・機械学習の流れや実行方法

【第2版のポイント】
・Python 3.10対応
・よりわかりやすい解説
・Pythonデータ分析試験の主教材に指定

【本書で学べること】
・Pythonの基本的な文法
・データフォーマットについて
・データの前処理技術
・データの可視化技術
・既存アルゴリズムでの機械学習の実装方法

【対象読者】
データ分析エンジニアを目指す方

【目次】
第1章 データ分析エンジニアの役割
第2章 Pythonと環境
第3章 数学の基礎
第4章 ライブラリによる分析の実践
第5章 応用:データ収集と加工

画像01
画像02
画像03
第1章 データ分析とは
第2章 Pythonと環境
第3章 数学の基礎
第4章 ツールの基礎
第5章 応用:データ収集と加工

付属データはこちら

お問い合わせ

内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。

正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。

利用許諾に関するお問い合わせ

本書の書影(表紙画像)をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影(表紙画像)以外のご利用については、こちらからお問い合わせください。

  • よくある質問

    Q:P.154でpandas 2.x以降を利用する場合
    A:本書で解説している環境とは異なりますが、pandas 2.0 以降(pandas 2.1でも同様)で同じ属性を上書きする場合は、

    df.loc[:, "摂取カロリー"] = XXXX

    の先頭を変更し、以下のようにすることで解消します。

    df["摂取カロリー"] = XXXX


    Q:P.175でpandas 2.0.xを利用する場合
    A:numeric_onlyという引数がcorr()メソッドにが導入されたのが、pandas1.5.0となります。numeric_only のdefaultがFalseに変わったのが pandas2.0.0です。
    pandas 1.5.0以降で、corr()メソッドを使うと、数値型以外の列で発生します。
    pandas 1.5.0以降を利用する場合は、P.175の相関係数の「In」を以下のように変更してください。


    --------------------
    df.corr(numeric_only=Ture)
    --------------------
この商品の「よくある質問」はありません。

ご購入いただいた書籍の種類を選択してください。

書籍の刷数を選択してください。

刷数は奥付(書籍の最終ページ)に記載されています。

現在表示されている正誤表の対象書籍

書籍の種類:

書籍の刷数:

本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。

対象の書籍は正誤表がありません。

最終更新日:2025年01月20日
発生刷 ページ数 書籍改訂刷 電子書籍訂正 内容 登録日
1刷 078
数式3.6.1の下の1-2行目の本文
分散は、すべてのデータの平均値からのズレを2乗して、データの個数で割った値です。
分散は、すべてのデータについて平均値との差を2乗したものを足し合わせ、データの個数で割った値です。
2024.01.18
1刷 162
最初のInの1行目
2刷
ng = np.random.default_rng(123)
rng = np.random.default_rng(123)

※リフローEPUBの場合、「4.2.4 時系列データ」の2つ目の小見出し「1年分365日のデータを作る」の2つ目の「In」が該当箇所になります。
2022.10.25
1刷 168
上から1行目
最後に、平均値、中央値、最頻値で欠損値を保管する方法を確認します。
最後に、平均値、中央値、最頻値で欠損値を補完する方法を確認します。
2025.01.20
1刷 245
全ページから続く「In」
3刷
X, y = housing.data, housing.target
# 学習データセットとテストデータセットに分割
X_train, X_test, y_train, y_test = train_test_split(X, y,
test_size=0.3, random_state=0)
X, y = housing.data, housing.target
# 学習データセットとテストデータセットに分割
X_train, X_test, y_train, y_test = train_test_split(
                   X, y, test_size=0.3, random_state=123)

※リフローEPUBの場合、「4.4.3 回帰」の最初の「In」の2つ目のコメント行の下が該当箇所になります。
2023.07.18
1刷 263
Out
2刷
1つ目の[Out]
GridSearchCV(cv=10, estimator=DecisionTreeClassifier(),
            param_grid={'max_depth': [3, 4, 5]})
3つ目の[Out]
DecisionTreeClassifier(max_depth=4)
4つ目の[Out]
array([ 1, 2, 2, 1, 0, 2, 1, 0, 0, 1, 2, 0, 1, 2, 2, 2, 0, 
        0, 1, 0, 0, 1, 0, 2, 0, 0, 0, 2, 2, 0, 2, 1, 0, 0,
        1, 1, 2, 0, 0, 1, 1, 0, 2, 2, 2])
1つ目の[Out]
GridSearchCV(cv=10, estimator=DecisionTreeClassifier(random_state=123),
            param_grid={'max_depth': [3, 4, 5]})
3つ目の[Out]
DecisionTreeClassifier(max_depth=3, random_state=123)
4つ目の[Out]
array([ 1, 2, 2, 1, 0, 1, 1, 0, 0, 1, 2, 0, 1, 2, 2, 2, 0, 
        0, 1, 0, 0, 1, 0, 2, 0, 0, 0, 2, 2, 0, 2, 1, 0, 0,
        1, 1, 2, 0, 0, 1, 1, 0, 2, 2, 2])

※リフローEPUBの場合「4.4.6 ハイパーパラメータの最適化」の1つ目、3つ目、4つ目の「Out」が該当箇所になります。
2022.10.25
1刷 268
上から1行目
縦軸のPetal Widthが2以下の領域が1つのクラスタを形成し(cluster 1)、
縦軸のPetal Widthが2以下の領域が1つのクラスタを形成し(cluster 2)、
2024.04.01
1刷 281
リストの上から13-19行目(スクレイピング先のページのHTML構造が変わったため)
# 販売価格を取得 price_s = div_txt.find("p", class_="price").text price_s = price_s.strip() price_s = price_s.replace("販売価格:", "") price_s = price_s.replace("円(税込)", "") price_s = price_s.replace(",", "") price = int(price_s)
# 販売価格を取得 price_s = div_txt.find("span", class_="sale-price").parent.text price_s = price_s.strip() price_s = price_s.replace("円(税込)送料無料", "") price_s = price_s.replace(",", "") price = int(price_s)
2024.04.22