PythonによるWebスクレイピング 第2版を読んだ
Amazonのレビューはなかったが、本屋で立ち読みして良さそうだったので購入してみた。税込3500円。
PythonによるWebスクレイピング 第2版
本書は初心者には難解な部分もある。章末に「さらに学ぶために」とあり、他の書籍を勧められる。各章ごとに深入りはせず、さらっと説明するに留めてある。
内容紹介
インターネットからデータを機械的に集め、必要な情報を抽出するWebスクレイピングにより、インターネット上の膨大な情報の中から、検索エンジンだけでは入手できない本当に必要な情報を入手できるようになります。
Webスクレイパーの基礎をていねいに解説するだけでなく、データの抽出、データの格納、データ収集後のクリーニング、さらには、JavaScript実行、Seleniumによる自動化、OCRを含めた自然言語処理、並列処理などの高度なトピックに加えて法律面の解説など、Webスクレイピングを実際に行うために必要なプログラミングテクニックとテクノロジー全般だけでなく、問題に遭遇した際の対処法まで紹介します。
豊富な事例から、自分の問題に合ったツールを選択し、解決することが容易となります。
Scrapy 1.6などPython 3に全面的に対応した待望の改訂版です。
期待していたJavascriptで動的に表示されたWebサイトの情報を収集するためにScrapy(クローラーフレームワーク)のJavascript実行、scrapy-splashの記載がなかったのは残念だった。本書がおすすめするScrapyを学びたい人はこの本を読んでと章末に紹介された本は「Learning Scrapy 2nd Edition」という英文で書かれた本だった。
私は英文が読めないためあきらめるしかないと思った。けど気になったのでAmazonで調べてみると2017年9月に発売され、評価が106個、高評価が7割を超えていたため、勉強するには購入することが望まれると思った。しかし、発売日2017年9月はおよそ2年前に書かれた本であるため、コードが少々古い可能性もあると考えられる。…ここまで調べ終えて、本の内容を翻訳してみたら間違い、機械学習とディープラーニングについて書かれた本だった。完全な誤り。英語で書かれてあるため本の内容がパッと見てわからなかったのだ。
改めて調べ直すと、おすすめされてある「Learning Scrapy 2nd Edition」という書籍は「This 2nd edition of this book will soon be released.(この本の第2版は間もなくリリースされます。)」と書かれてあり、まだ発売されていないようだった。しかし英語で書かれてあることには変わりはない。英文解読の道のりは険しい。私がもしも帰国子女だったらと思うと悔やまれてならない。
コメントはこちら
コメント一覧
無駄な努力をする浜田。
本当に愚かだな
おまえ、意味ないことしかしてないよ