【本書の目的】
本書は、Pythonを利用して、人工知能分野で注目されている
自然言語の分析手法を解説した書籍です。
従来技術と新技術を比較しつつ、
「インデックス化」「エンティティ抽出」「関係抽出」
「構文解析」「評価・感情・概念分析」を網羅。
Pythonによるプログラムや、APIの利用、
商用サービス(IBM Watson)や
OSS(Mecab/Elasticsearch/Word2Vec)の利用など、
実践的な手法を解説します。
また最終章で話題のBERTについて解説します。
【本書の特徴】
本書は全体で5章構成になっています。
第1章:テキスト分析の概要をユーザ―目線、エンジニア目線の両方から丁寧に解説します。
第2章:テキスト分析のタスクを上げ、実際の分析までの具体的な方法を解説します。
第3章:AIの発達する前から利用されていたテキスト分析の手法について、
MecabやElasticsearchといったOSSを利用して解説します。
第4章:IBM社のWatson APIのAI技術を利用したテキスト分析手法を解説します。
第5章:Word2VecというOSSを利用した分析手法や、話題のBERTについて解説します。
【対象読者】
自然言語処理を学びたい理工学生・エンジニア
【著者プロフィール】
赤石雅典(あかいし・まさのり)
1987年日本アイ・ビー・エムに入社。東京基礎研究所で数式処理システムの研究開発に従事する。
1993年にSE部門に異動し、主にオープン系システムのインフラ設計・構築を担当。
2013年よりスマーターシティ事業、2016年8月にワトソン事業部に異動し、今に至る。
現在は、Watson Studio / Watson OpenScaleなどデータサイエンス系製品の提案活動が主体。
江澤美保(えざわ・みほ)
株式会社クレスコ。企業向けWebポータル製品の開発、大規模事務管理の海外移管プロジェクト、
決済サービスのフィールドエンジニア等を経て先端技術の法人営業に転向。
2015 年よりIBM Watsonに携わり、経営層へのWatson導入提案を多く経験。
現在は企業のAI導入支援を手掛けるAIコンサルタント・エンジニアとして活動中。
2019年よりIBM Champion。
Chapter 1 テキスト分析とは
1.1 テキスト分析の目的
1.2 テキスト分析の要素技術
Chapter 2 日本語テキスト分析:前処理の勘所
2.1 テキストの入手
2.2 形態素解析
Chapter 3 従来型テキスト分析・検索技術
3.1 係り受け
3.2 検索
3.3 日本語の検索
3.4 検索結果のスコアリング
3.5 類似検索
Chapter 4 商用APIによるテキスト分析・検索技術
4.1 IBM Cloudにおけるテキスト分析系APIの全体像
4.2 NLU(Natural Language Understanding)
4.3 Knowledge Studio
4.4 Discovery
4.5 Discoveryを使う
4.6 API経由でDiscoveryを使う
4.7 Discoveryによるランキング学習
4.8 APIを利用したDiscoveryのランキング学習
Chapter 5 Word2VecとBERT
5.1 Word2Vecモデル概要
5.2 Word2Vecを使う
5.3 Word2Vec利用事例
5.4 Word2Vec関連技術
5.5 転移学習とBERT
APPENDIX 1 実習で利用するコマンド類の導入
APPENDIX 2 Jupyter Notebookの導入手順
APPENDIX 3 IBMクラウドの利用手順
内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。
正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。
本書の書影(表紙画像)をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影(表紙画像)以外のご利用については、こちらからお問い合わせください。
刷数は奥付(書籍の最終ページ)に記載されています。
書籍の種類:
書籍の刷数:
本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。
対象の書籍は正誤表がありません。
発生刷 | ページ数 | 書籍改訂刷 | 電子書籍訂正 | 内容 | 登録日 | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|
1刷 | 085 上から10行目 |
未 | 未 |
|
2020.03.17 | ||||||
1刷 | 278-279 図5.1.4と図5.1.5の図が逆 |
未 | 未 |
|
2020.03.17 |
P.N.平日友 さん
2020-06-04
自然言語処理分野の概念と利用方法などが記載されている。活用するにあたりどのようなことができるのか大枠を掴む目的で読了。商用apiを使用方法など実践的なものから言語のベクトル変換、最後に転移学習・attention、bertに軽くふれて終わっている。初読のためコードは読むだけだったけれど、次回は実際に動かしてみたい。入門とあるけれどゼロからのひとは取っつきにくいかも。