Pythonで動かして学ぶ 自然言語処理入門 電子書籍(柳井 孝介 庄司 美沙)|翔泳社の本
  1. ホーム >
  2. 電子書籍 >
  3. Pythonで動かして学ぶ 自然言語処理入門

Pythonで動かして学ぶ 自然言語処理入門



形式:
電子書籍
発売日:
ISBN:
9784798160962
価格:
3,520(本体3,200円+税10%)
カテゴリ:
プログラミング・開発
キーワード:
#プログラミング,#開発環境,#開発手法,#Web・アプリ開発
電子書籍

本書は、Pythonでプログラミングをした経験のある読者が、
各種オープンソースソフトウェア(OSS)やライブラリを利用して、
自然言語処理を行うWebアプリケーションを作って動かし、 自然言語処理を体験するための書籍です。

またその中で、自然言語処理に関連するさまざまな概念や手法、
簡単な理論についても学ぶことができ、本格的な学習の
前段階としても最適です。

本書の構成としては大きく2つの部に分かれており、
それぞれ以下のような内容を解説しています。

第1部:データの準備
●テキストデータの収集
●データベースへの格納
●検索エンジンへの登録

第2部:データの解析
●文法構造を調べる
●意味づけ
●知識データとの連係

全13章を順に追いながらWebアプリケーションを作っていくことで、
自然言語処理に関連するさまざまなテーマを学ぶことができます。

※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

(翔泳社)

身近なテキストも、膨大な文書も、探す!使う!見える化する!

本書は、Pythonでのプログラミング経験がある人が、各種オープンソースソフトウェア(OSS)やライブラリを利用して、自然言語処理を行うWebアプリケーションを作って動かし、 自然言語処理を体験するための書籍です。またその中で、自然言語処理に関連するさまざまな概念や手法、簡単な理論についても学ぶことができ、本格的な学習の前段階としても最適です。


本書の構成としては大きく3つの部に分かれており、 それぞれ以下のような内容を解説しています。

本書の構成
目次の登録はありません。

付属データはこちら

お問い合わせ

内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。

正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。

利用許諾に関するお問い合わせ

本書の書影(表紙画像)をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影(表紙画像)以外のご利用については、こちらからお問い合わせください。

  • 著者からの補足情報

    刊行から2年がたち、本書で紹介しているライブラリも
    バージョンアップがされたものが多くなり、
    サンプルを動作させるために、ライブラリのバージョンについての
    お問い合わせを受けることが増えてきました。

    そこで、以下に本書で利用している各ライブラリの
    バージョンをまとめましたので、
    ・pip installコマンドを実行する際に、それぞれのバージョンを指定する
    ・作業フォルダにrequirements.txtファイルを以下の内容で作成し、
     pip install -r requirements.txtコマンドを実行する
    などの方法でご利用ください。

    ahocorapy==1.6.1
    beautifulsoup4==4.10.0
    bottle==0.12.19
    cabocha-python==0.69
    cchardet==2.1.7
    chainer==7.8.0
    click==8.0.1
    filelock==3.3.0
    future==0.18.2
    gensim==3.7.0
    importlib-metadata==4.8.1
    isodate==0.6.0
    joblib==1.0.1
    nltk==3.6.4
    numpy==1.19.5
    protobuf==3.18.1
    pyparsing==2.4.7
    rdflib==5.0.0
    regex==2021.9.30
    scikit-learn==0.20.2
    scipy==1.2.0
    six==1.16.0
    sklearn==0.0
    smart-open==5.2.1
    soupsieve==2.2.1
    SPARQLWrapper==1.8.5
    threadpoolctl==3.0.0
    tqdm==4.62.3
    typing-extensions==3.10.0.2
    zipp==3.6.0
この商品の「よくある質問」はありません。

ご購入いただいた書籍の種類を選択してください。

書籍の刷数を選択してください。

刷数は奥付(書籍の最終ページ)に記載されています。

現在表示されている正誤表の対象書籍

書籍の種類:

書籍の刷数:

本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。

対象の書籍は正誤表がありません。

最終更新日:2019年02月12日
発生刷 ページ数 書籍改訂刷 電子書籍訂正 内容 登録日
1刷 027
リスト2.3 最下行
2刷
print('[block]':, block.text)
print('[block]:', block.text)
2019.01.28
1刷 029
リスト2.4
2刷
import re import unicodedata text = ' CLEANS ing によりテキストデータを変換すると トラブルが少なくなります。' print("Before:", text) text = unicodedata.normalize('NFKC', text) text = re.sub(r'\s+', '', text) print("After:", text)
import re import unicodedata text = ' CLEANS ing によりテキストデータを変換すると トラブルが少なくなります。' print("Before:", text) translation_table = str.maketrans(dict(zip('()!', '()!'))) text = unicodedata.normalize('NFKC', text).translate(translation_table)←❶ text = re.sub(r'\s+', '', text) print("After:", text)
2019.01.28
1刷 029
リスト2.5
2刷
import re import unicodedata from bs4 import BeautifulSoup def cleanse(text): text = unicodedata.normalize('NFKC', text) text = re.sub(r'\s+', ' ', text) (以下略)
import re import unicodedata from bs4 import BeautifulSoup translation_table = str.maketrans(dict(zip('()!', '()!'))) def cleanse(text): text = unicodedata.normalize('NFKC', text).translate(translation_table) text = re.sub(r'\s+', ' ', text) (以下略)
2019.01.28
1刷 029
「2.5 データ収集のプログラム」直前の段落
2刷
これにより、例えば半角カタカナは全角カタカナへ、全角英字は半角英字へ、全角空白記号は半角空白記号へ正規化されます。
これにより、例えば半角カタカナは全角カタカナへ、全角英字は半角英字へ、多くの全角記号は半角記号へ、全角空白記号は半角空白記号へ正規化されます。ただし、CaboChaの入力は全角記号を前提としているため、丸括弧と「!」を全角記号に戻しておきます。
2019.01.29
1刷 173
リスト9.8
2刷
import bottle import dbpediaknowledge import solrindexer as indexer
import bottle import solrindexer as indexer
2019.01.31
1刷 262
ソースコード
2刷
2019.02.12
1刷 263
「13.5 CRF++を用いた学習」直前にある長いソースコード
2刷
2019.02.12
1刷 263
本文7行目 (「13.5 CRF++を用いた学習」直前にある長いソースコードの直前の段落の1行目)
2刷
「英語」「版」「()」の行のラベルを
「英語」「版」「)」「(」の行のラベルを
2019.01.31

感想・レビュー

na さん

2021-11-19

検索エンジン作成までの大体の概念はわかった。 ソースコードもあって具体イメージ掴めて、サラッと読めて○。 ただ利用技術がちょっと古めだったりしたから、そこは別途勉強したい。