現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法 電子書籍|翔泳社の本
  1. ホーム >
  2. 電子書籍 >
  3. 現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法

現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法


形式:
電子書籍
発売日:
ISBN:
9784798161440
価格:
4,180(本体3,800円+税10%)
カテゴリ:
人工知能・機械学習
キーワード:
#プログラミング,#開発手法,#データ・データベース,#ビジネスIT
シリーズ:
AI & TECHNOLOGY
電子書籍

機械学習エンジニア&データサイエンティスト必携!
初学者でもpandasによる前処理手法がわかる

【本書の背景】
機械学習やデータサイエンスでは、いかに「きれいなデータ」を用意できるかが非常に重要です。データクレンジングともいわれますが、実際の現場のデータは、機械学習やデータ分析にすぐ利用できるデータは皆無に等しく、エンジニアによりデータの前処理が必須となってきています。

【本書の概要】
本書は、機械学習やデータサイエンスの現場では、データ処理に必要な定番のライブラリ「pandas」を用いて、前処理の基本と様々な前処理手法について、あますところなく解説した書籍です。
初学者向けにシンプルでわかりやすいサンプルを用いていますので、pandasの基本操作方法やデータ構造、さらに前処理の基本の理解についてもしっかり学ぶことができます。
pandasを理解することで、様々な機械学習・データ分析タスクがスムーズに行えるようになります。

【本書の対象読者】
・機械学習エンジニア(初学者)
・データサイエンティスト(初学者)

【著書からひとこと】
本書では機械学習「初学者向け」にpandasの基本的な操作を解説しています。初歩的な要約統計量の算出やグループ化やダミー変数、さらに文字列や時系列データの基本操作など、幅広い範囲をカバーしています。
日々、データを業務で取り扱う機械学習エンジニアやKaggle等のデータ分析競技をやられている方に向けて、pandasを使ったデータ前処理のお役に立てばと思い執筆いたしました。

※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

(翔泳社)

機械学習エンジニア&データサイエンティスト必携!初学者でもpandasによる前処理手法がわかる。

機械学習エンジニア&データサイエンティスト必携!初学者でもpandasによる前処理手法がわかる。

本書は「pandas」を用いて、前処理の基本について、あますところなく解説した書籍です。初学者向けにシンプルでわかりやすいサンプルを用いていますので、pandasの基本操作方法やデータ構造、さらに前処理の基本の理解についてもしっかり学ぶことができます。pandasを理解することで、様々な機械学習・データ分析タスクがスムーズに行えるようになります。

本書の構成
目次の登録はありません。

付属データはこちら

会員特典はこちら

お問い合わせ

内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。

正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。

利用許諾に関するお問い合わせ

本書の書影(表紙画像)をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影(表紙画像)以外のご利用については、こちらからお問い合わせください。

追加情報はありません。
この商品の「よくある質問」はありません。

現在表示されている正誤表の対象書籍

書籍の種類:電子書籍

書籍の刷数:全刷


※重版をした際に、内容が修正されている場合があります。「刷数の確認方法(例)」の図を参考に、お手元の書籍の刷数をご確認ください。下の「書籍の刷数」の欄で刷数を選択すると、お持ちの書籍の刷数に合わせて、正誤情報を絞り込むことができます。

書籍によっては表記が異なる場合がございます


本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。

対象の書籍は正誤表がありません。

 書籍の刷数で正誤情報を絞り込みたい場合は選択してください。

 書籍の種類:

最終更新日:2021年11月25日
ページ数 内容 発生刷 書籍修正刷 電子書籍訂正 登録日
004
ページ全体
以下に差し替えます。


URL
https://pandas.pydata.org/

※リフローEPUBの場合、「1.1 機械学習の分野でなくてはならないライブラリ「pandas」」のCOLUMN「pandasとNumPyの違いについて」が該当箇所になります。
1刷 2刷 2020.11.10
139
本文上から4行目(リストの行除く)
 goupbyメソッドは…
 groupbyメソッドは…

※リフローEPUBの場合、リスト2.125の下にある2つ目の段落が該当箇所になります。
1刷 3刷 2020.11.20
424
表7.1のキャプション
GoupByオブジェクトの集約メソッド(一部)
GroupByオブジェクトの集約メソッド(一部)
1刷 3刷 2021.11.25
457
本文上から3行目
spitメソッドを使います。
splitメソッドを使います。

※リフローEPUBの場合、「8.1.2 文字列の分割」の最初の段落が該当箇所になります。
1刷 3刷 2020.08.07
532
リスト8.118のキャプション
goupbyメソッドとlevel引数
groupbyメソッドとlevel引数
1刷 3刷 2021.11.25

感想・レビュー

畠山 大有 さん

2021-10-06

pandas の関数の解説本。データ前処理のノウハウについての記述は少ない。最終章に微量がある程度。 私にとってコンピューター関連の本は、ページ数の割には読む時間は早い…

ais さん

2021-01-31

pandasの基本的な使い方を把握できたと思う。これからは辞書感覚で使う。