3.A.9. PDFファイルの読み込みと解析

この例では、PDF ファイルからデータを抽出し、収集したデータを正規表現(https://ryanstutorials.net/regular-expressions-tutorial/)で処理し、CSV ファイルに保存するワークフローを作成します。

まず、データの抽出に使用するインボイスファイルをダウンロードする必要があります。このリンク(https://github.com/open-rpa/examples-files/raw/master/bpa-doc/parse_pdf/Horkheimer%20Technologies%20LLC.pdf)で入手可能です。

その手順は以下の通りです。

  1. PDFからテキストデータを抽出します。

  2. Match Regular Expression グループ。

  3. 結果を格納するDataTableを作成します。

  4. DataTableに行を追加する。

  5. DataTableをCSVに保存します。