3.A.9. PDFファイルの読み込みと解析 – AI・人工知能開発サービス

この例では、PDF ファイルからデータを抽出し、収集したデータを正規表現（https://ryanstutorials.net/regular-expressions-tutorial/）で処理し、CSV ファイルに保存するワークフローを作成します。

まず、データの抽出に使用するインボイスファイルをダウンロードする必要があります。このリンク先（https://github.com/open-rpa/examples-files/raw/master/bpa-doc/parse_pdf/Horkheimer%20Technologies%20LLC.pdf）で入手可能です。

その手順は以下の通りです。

PDFからテキストデータを抽出します。
Match Regular Expression グループ。
結果を格納するDataTableを作成します。
DataTableに行を追加する。
DataTableをCSVに保存します。