この例では、PDF ファイルから
データを抽出し、収集したデータを正規表現(https://ryanstutorials.net/regular-expressions-tutorial/
)で処理し、CSV ファイルに
保存するワークフローを
作成します。
まず、データの抽出に使用するインボイスファイルをダウンロードする必要があります。このリンク先(https://github.com/open-rpa/examples-files/raw/master/bpa-doc/parse_pdf/Horkheimer%20Technologies%20
LLC.pdf)で入手可能です。
その手順は以下の通りです。
-
PDFからテキストデータを抽出します。
-
Match Regular Expression グループ。
-
結果を格納する
DataTableを
作成します。 -
DataTableに
行を追加する。 -
DataTableを
CSVに保存します。