Brett Lantz 著
株式会社クイープ 翻訳
株式会社クイープ 監修
【本書の内容】
本書は
Brett Lantz, "Machine Learning with R - Third Edition",
Packt Publishing, 2019
の邦訳版です。
本書は「機械学習」で語られることの多い手法(最近傍法や回帰法、ナイーブベイズ
や決定木を使った分類法)を網羅し、それぞれの意味や成立条件を解説します。
といっても、ゴリゴリの数式だけを使うわけではなく、既存のデータを使用し、
それら手法によって解析した結果、どのようなグラフが表示されるか、を
手取り足取りで解説してくれます。
ですから、機械学習を構成するさまざまな手法を、実際に使えるレベルで理解できる
ようになります。
そのため、自身が関わるプロジェクトにおいて、どの手法がベストプラクティスと
なるのか、無意味な分析・解析を避ける勘所がわかるようになるでしょう。
「機械学習」を学んだものの「もやもや」に付きまとわれているエンジニアに
よく効く一冊です。
【本書のポイント】
・「機械学習」と呼ばれる手法を網羅
・手法を構成する手続きやその前準備を微細に解説
・各手法のメリットとデメリットも紹介
・実際に手を動かすことで各種手法を正しく利用できるようになる
【読者が得られること】
・機械学習とその派生手法のモデルを頭の中に構築できる
・機械学習を成立させるさまざまな手法に精通できる
・プロジェクトで真に必要な手法がわかる
・(ついでに)R言語(4.x系)も習得できる
【著者について】
・Brett Lantz(ブレット・ランツ)
社会学者として教育を受けた著者は、人間の行動を理解するために10年以上に
わたってイノベーティブなデータ手法を活用してきた。
DataCampの講師であり、世界中の機械学習カンファレンスやワークショップで
たびたび講演を行っている。
※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。
(翔泳社)
本書は『Brett Lantz, "Machine Learning with R - Third Edition",Packt Publishing, 2019』の邦訳版です。
機械学習の中心には、情報を意思決定に活かせる知識に変えるアルゴリズムがあります。このため、機械学習はこのビッグデータ時代にぴったりです。機械学習がなければ、とめどなく流れる情報を追いかけることはとてもできないでしょう。Rはクロスプラットフォームでコストのかからない統計学的プログラミング環境であり、その存在感が増していることを考えると、機械学習を始めるのに絶好のタイミングです。Rが提供するツールは強力でありながら習得しやすいため、データから知見を見つけ出すのに貢献するでしょう。本書では、内部の仕組みを理解するために必要な基本的な理論に実践的なケーススタディを組み合わせることで、機械学習への取り組みを開始するのに必要な知識をすべて提供します。
機械学習のさまざまな学習器を定義および区別している用語や概念に加えて、学習タスクに適切なアルゴリズムをマッチさせる方法を紹介します。
Rを使ってデータを実際に操作する機会を提供し、データを読み込み、調査し、理解するための基本的なデータ構造と手続きについて説明します。
単純ながら強力な機械学習アルゴリズムを理解し、悪性腫瘍の識別という最初の現実的なタスクにどのように適用すればよいかを示します。
最先端のスパムフィルタリングシステムで使われている基本的な確率の概念を明らかにします。独自のスパムフィルタを構築しながらテキストマイニングの基礎を学びます。
正確なだけではなく簡単に説明できる予測値を生成する学習アルゴリズムを2つ取り上げます。そして、透明性が重視されるタスクにこれらのアルゴリズムを適用します。
数値を予測するための機械学習アルゴリズムを紹介します。これらの手法は統計学と深く結び付いているため、数値的な関係を理解するのに必要な、基本的な指標も取り上げます。
複雑ながら強力な機械学習アルゴリズムを2つ取り上げます。これらのアルゴリズムで使われている数学が難しく感じられるかもしれませんが、例を交えながら、それらの内部の仕組みをわかりやすい言葉で説明します。
多くの小売業者が導入しているレコメンデーションシステムで使われているアルゴリズムを取り上げます。小売業者のほうが自分の購入習慣をよく知っているように感じたことはないでしょうか。この章では、その秘密が明らかになります。
関連するアイテムをクラスタ化する方法について説明します。そして、オンラインコミュニティのプロフィールの特定にこのアルゴリズムを利用します。
機械学習プロジェクトの成否を評価する方法と、未知のデータに対する学習器の性能を信頼できる推定値として取得する方法について説明します。
機械学習コンテストの上位チームが採用している手法を明らかにします。コンテストに参加したい場合、あるいはデータからできるだけ多くの価値を引き出したいだけあっても、これらの手法をレパートリーに加える必要があるでしょう。
ビッグデータからRの高速化まで、機械学習の最前線を探ります。これらのトピックはRでできることの限界を押し広げるのに役立つでしょう。
内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。
正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。
本書の書影(表紙画像)をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影(表紙画像)以外のご利用については、こちらからお問い合わせください。