PythonでWebページをPDFに変換する方法

jupyterノートブックでコードドキュメントを作成する場合、pdfバージョンをエクスポートする必要がある場合がありますが、jupyterはエラーを報告します。オンラインデバッグ方式以外に、pdfを生成するソリューションはないと思っていました。

Du Niangが検索し、多くのブログでPythonのサードパーティライブラリ pdfkitが推奨されています。このライブラリは、ウェブページ、htmlファイル、文字列からpdfファイルを生成できます。

実際、pdf生成サービスを提供するソフトウェアはたくさんありますが、これはあまりにもPython的なので、 pdfkitの使い方を試してみましょう。

pdfドキュメントを自動的に生成する3つのステップ:

  1. pipを使用して pdfkitライブラリをインストールします

Pythonバージョン3.x、コマンドラインに入力します。

pip install pdfkit

インストールプロセスは基本的に問題ありません。上記の「Successfullyinstalledpdfkit-0.6.1」プロンプトが表示され、インストールが成功したことを示します。

  1. wkhtmltopdf.exeファイルをインストールします

注:pdfkitはwkhtmltopdfに基づくpythonパッケージであるため、wkhtmltopdf.exeをインストールする必要があります。 wkhtmltopdfは軽量のソフトウェアで、インストールが非常に簡単です。

ダウンロードリンク:

https://wkhtmltopdf.org/downloads.html

wkhtmltopdfをダウンロード

ダウンロードが完了したら、次に進み、wkhtmltopdfをインストールします。

必ずインストールアドレスを覚えておき、 wkhtmltopdf.exeファイルが配置されている絶対パスを見つけて、後で使用してください。

ここでの私のデフォルトパスは " "C:\ Program Files \ wkhtmltopdf \ bin \ wkhtmltopdf.exe" "

wkhtmltopdfをインストールします

  1. pdfkitライブラリを使用してpdfファイルを生成します

前述のように、 pdfkitウェブページ、htmlファイル、文字列からpdfファイルを生成できます。

# ライブラリをインポートする
import pdfkit

''' Webページからpdfファイルを生成する'''
def url_to_pdf(url, to_file):
 # wkhtmltopdfを追加.exeプログラムの絶対パスがconfigオブジェクトに渡されます
 path_wkthmltopdf = r'C:\\Program Files\\wkhtmltopdf\\bin\\wkhtmltopdf.exe'
 config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
 # pdfファイルを生成します_fileはファイルパスです
 pdfkit.from_url(url, to_file, configuration=config)print('実施する')

# ここに渡して、列のURLを知っていて、それをpdfに変換します
url_to_pdf(r'https://zhuanlan.zhihu.com/p/69869004','out_1.pdf')
# ライブラリをインポートする
import pdfkit

''' htmlファイルからpdfファイルを生成する'''
def html_to_pdf(html, to_file):
 # wkhtmltopdfを追加.exeプログラムの絶対パスがconfigオブジェクトに渡されます
 path_wkthmltopdf = r'C:\\Program Files\\wkhtmltopdf\\bin\\wkhtmltopdf.exe'
 config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
 # pdfファイルを生成します_fileはファイルパスです
 pdfkit.from_file(html, to_file, configuration=config)print('実施する')html_to_pdf('sample.html','out_2.pdf')
# ライブラリをインポートする
import pdfkit

''' 文字列からpdfファイルを生成する'''
def str_to_pdf(string, to_file):
 # wkhtmltopdfを追加.exeプログラムの絶対パスがconfigオブジェクトに渡されます
 path_wkthmltopdf = r'C:\\Program Files\\wkhtmltopdf\\bin\\wkhtmltopdf.exe'
 config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
 # pdfファイルを生成します_fileはファイルパスです
 pdfkit.from_string(string, to_file, configuration=config)print('実施する')str_to_pdf('This is test!','out_3.pdf')
  1. 結論として

この記事では、 pdfkitライブラリを使用してPythonでpdfファイルを生成する方法について説明します。これは非常に便利で高速で、バッチ自動化に適しています。

生成されたpdfの効果を見てみましょう:

pdfエフェクト表示

ページ全体の見た目が良いので、急いで使ってください!

Recommended Posts

PythonでWebページをPDFに変換する方法
Pythonで地球を作る方法
pythonでexcelテーブルを処理する方法
Pythonをすばやく開始する方法
PythonによるWebスクレイピング
UbuntuでPython3を楽しくプレイする方法
Python空の列を持つ行を削除する方法
Pythonでファイルを読み書きする方法
pythonファイルの読み取りエラーに対処する方法
pythonコードにコメントする方法
pythonをすばやく学ぶ方法
pythonプラグインをアンインストールする方法
pythonオブジェクトを理解する方法
パイソンタプルの使い方
pythonウェブページコードの表示方法
pythonスレッドプールの使用方法
python設定ファイルの書き方
pythonコードでラップする方法
pythonプログラムを保存する方法
Pythonで括弧を省略する方法
CentOS8にPython3.8をインストールする方法
Ubuntu18.04にPython3.8をインストールする方法
pythonでクラスを書く方法
pythonで数値をフィルタリングする方法
Centos6.7には、へのpythonアップグレードが付属しています
PythonでExcelを読む方法
CentOS8にPythonをインストールする方法
python dict garbledを解決する方法
pythonでエラーを表示する方法
pythonでreturnを書く方法
pythonモジュールを表示する方法
Pythonで変数を理解する方法
pythonで変数をクリアする方法
pythonオブジェクト指向プログラミングを理解する方法
Pythonはpdfkitを使用してpdfを生成します[python]
PythonでSQLiteを使用する方法
pythonのインストールが成功したことを確認する方法
およびおよびまたはPythonでの使用方法
pythonでキャッシュファイルを削除する方法
Pythonでサードパーティモジュールを導入する方法
pythonでnull値を表す方法
pythonでテキストファイルを保存する方法
PYTHONを使用してニュース記事をクロールする方法
PythonWeb開発の完全ガイド
pythonでwinプログラムを書く方法
pythonでid関数を実行する方法
Pythonでサードパーティモジュールをインストールする方法
pythonでエラーをカスタムキャッチする方法
pythonでtryステートメントを書く方法
Pythonでプライベート属性を定義する方法
R&D:CentOS7にPython3をインストールする方法
Pythonでカスタムモジュールを追加する方法
Pythonでグローバル変数を理解する方法
インストールされているモジュールをpythonで表示する方法
Ubuntu20.04 ubuntu / focal64にPython2をインストールする方法
reprを使用してpythonプログラムをデバッグする方法
Pythonタイムモジュールを学ぶ方法
さまざまなシステムでのPythonopenメソッド
pythonで辞書を並べ替える方法
python三重引用符の入力方法
pythonで背景音楽を追加する方法