日本图书 计算机・IT

Pythonでの自動化・仕事効率化入门 - スクレイピング编 - Pythonを使って仕事を楽にしよう。


数量:
この度は、「Pythonでの自動化・仕事効率化入門 - スクレイピング編 - Pythonを使って仕事を楽にしよう。」を手に取っていただきまして、誠にありがとうございます。

本書はPythonというプログラミング言語を使って日々の業務や生活を効率化したい人のために、Pythonを使った自動化の基礎知識を整理して提供することを目的に執筆しました。

この内容は筆者がPythonを使って試行錯誤した成果をまとめたものです。

本書ではPythonを使用してネット上の情報を自動的に収集・整理するWebスクレイピングの技術について、基礎的な知識をまとめて習得できるようにまとめています。

ぜひこの本をきっかけに日常の業務や生活にPythonを活用してみてください。

本書はリフロー型のKindle電子書籍のフォーマットを採用しています。

一般的な紙の本とは異なる装丁を採用しているため、Kindle本をあまり利用されたことのない方は事前に「無料サンプルを送信する」の機能を利用して、確認をお願いします。

Pythonでの自動化・仕事効率化入門 - スクレイピング編 - Pythonを使って仕事を楽にしよう。

目次

1. Python

1.1 Python2とPython3
1.2 Pythonの基本的な取り扱い
1.3 Pythonの基本文法
1.4 venv

2. テキストエディタの導入

2.1 テキストエディタの選定
2.2 Atomを導入する
2.3 Atomの基本的な使い方
2.4 AtomでPythonのコードを書く


3. Webスクレイピング

3.1 Webスクレイピングとは何か?
3.2 Webスクレイピングを学ぶメリット
3.3 Webスクレイピングを行う時の注意点



4. HTML

4.1 HTMLとは何か?
4.2 XMLとは何か?
4.3 HTMLの基本
4.4 HTML5でのタグの役割


5. Beautiful Soup4

5.1 Beautiful Soup4とは?
5.2 Beautiful Soup4のインストール
5.3 Beautiful Soupの基本的な使い方
5.4 HTMLを解析する
5.5 オンラインからURLを指定してHTMLを取得する

6. データの保存(永続化)の方法

6.1 スクレイピングの結果をどのように保存するか?
6.2 CSV
6.3 Excelブック
6.4 データベース

7. Beautiful Soup4の応用

7.1 Webページにある画像を一括でダウンロードする
7.2 Webページにあるリンクをまとめて抜き出す。
7.3 特定のサイトのメタタグの使い方を一括で確認する
7.4 特定のWebサイトの記事一覧を取得する

8. RSS

8.1 RSSとは何か?
8.2 RSSの基本構造
8.3 Pythonで使えるRSSライブラリ
8.4 RSSの情報をCSVに保存する


9. Google Colaboratoryを使う

9.1 Google Colaboratoryを使う利点
9.2 Google Colaboratoryを使用する
9.3 Google Colaboratoryでのパッケージ管理
9.4 Google ColaboratoryでのWebスクレーピング
9.5 Google ColaboratoryからGoogleスプレッドシートを操作してスクレイピングの結果を保存する



おわりに