Power automate desktop pdf テキスト抽出

こんにちは!
パソコンインストラクター歴10年の
チサです。(*´∀`)

今日は
Power Automate Desktop🤖
PDFからテキストを抽出する方法を書きます!

PDFファイルに書いてある文字を
何かに使いたい!
ってときに便利!!

こういうPDFの請求書が
あったとします👇

わたしは
5人とも好きですけど
まつじゅんが一番すきです!

むかしやってたドラマ
花より団子の道明寺役が
めっちゃハマってましたよね♪

あ!話が脱線しちゃった!
戻します💦

えーーーと

そうそう!
このPDFの請求書

顧客コードや
名前
1000円

などの情報が書いてあります!

このPDFの文字を
ぬきだすことができるので
そのやり方を説明しますね!

最初に使うコマンドは
PDF>PDFからテキスト抽出

ここにこんなふうに入力👇

・PDFファイル:元のファイルの場所を🗒アイコンをクリックして設定

ここで抽出されたテキストは

ExtractedPDFTextっていう
変数に入ります。

ちょっと
請求書 0001 まつじ…って
途中までしか見えてないですね。

しっかり確認したいときは
(x)ExtractedPDFText
ダブルクリックすると全部見れますよ♪

ほら!
ちゃんと見えた!!!
ദ്ദി ˉ͈̀꒳ˉ͈́ )✧

つぎに必要なのは
テキスト>テキストの分割

ここにこんな感じで設定👇

・分割するテキスト:ExtractedPDFText
※{x}
をクリックして選びます!

・標準の区切り記号:新しい行

すると
TextList にこんな感じで値が入る!

これで準備はOKです!

分割された文字は
TextList という変数に
表のような形で入ってます。

こういうやつを
配列って言います。

TextListの
0番目 … 請求書
1番目 … 0001
2番目 … まつじゅん
3番目 … 1000円

じゃあ
メッセージボックスを使って
取り出してみますね!

取り出したい文字の番号を
[  ] でくくると取り出せます!

おもしろいでしょ?

こうやって
文字を取り出せたら
PDFファイル名を
顧客名や顧客コードに変更したり
そんなこともできます!!

たった2つのコマンドで
こんなことができるなんて
すごい✨

・PDF > PDFからテキスト抽出
・テキスト> テキストの分割

また
いろいろ試してみますね!


ではでは
またあした!
(*´꒳`*)/

◆6冊目Kindle📕
Excelショートカット【力試しドリル】

内緒でこっそり修行して
みんなを驚かせよう!
\_ヘ(ω`●)カタカタ

◆7冊目Kindle📕
海外バージョン♪

************
★チサのTwitter🐣

//twitter.com/chisa91010081

フォローしてもらえたら
めっちゃ喜びます!
ヽ(=´▽`=)ノ


◆チサのデビュー作✨📕

家計管理が苦手な方!
読んでくれたらうれしいな♪
(´∀`*)ウフフ

◆2冊目のKindle📕

Kindle出版に
興味のある方はぜひぜひ!
ヽ(=´▽`=)ノ

◆3冊目のKindle📕

読書が苦手な方にオススメ♪
(・∀・)イイネ!!


◆4冊目のKindle📕

関西弁に興味のある方はぜひ♬
楽しく関西弁をおぼえよう♪
(≧∇≦)b


◆5冊目のKindle📕

Kindle海外出版の経験談です!
チャレンジする価値✨
大アリです♪
(-ω☆)キラリ

PowerAutomate

2022.11.04

Power Automate Desktopで、PDFを読み取って画像・テキスト抽出する方法をご紹介します。

ぜひ、お試しください!

PDFから画像抽出

対象のPDF

PDFファイルの中に、5つの画像があります。


 

フロー全体像

フローは、たった1行です!


 

フロー作成

「PDFから画像を抽出します」


 

フロー実行

PDFファイルからすべての画像を抜き出して、

pngファイルで保存します。

PDFからテキスト抽出

対象のPDF

フォルダに複数のPDFがあります。

PDFは全て同じフォーマットです。


 

PDFファイルから文字を読み取り、Excelに転記します。


 

フロー全体像

フロー作成で、作り方を詳しく解説します。


 

フロー作成

1. 「フォルダーの選択ダイアログを表示」


 

2. 「フォルダー内のファイルを取得」

※「ファイルフィルター」で「*.pdf」と入力し、PDFファイルのみを対象とします。


 

3. 「Excelの起動」

新規ファイルを作成します。


 

4. 「For each」

フォルダ内にあるPDFファイルをループします。


 

5. 「PDFからテキスト抽出」


 

6. 「Excelワークシートから最初の空の列や行を取得」


 

7. 「Excelワークシートに書き込み」


 

フロー実行

「フォルダーの参照」が表示されるので、対象フォルダを選択する


 

PDFの文字列をExcelに書き込みできました。

手作業で、行列の幅を調整します。


 

複数PDFのすべての文字を、一括で転記することができました。

見た感じ、1文字残らず取得できています。PADすごい・・!

    以上、Power Automate Desktopの活用術でした。

この記事がお役に立ちますと幸いです。
 

【PowerAutomateDesktop】画像認識でLINE起動してみた

...

「シゴトがはかどる Power Automate Desktopの教科書」
業務自動化ツールの初心者でも使えるように、初歩から丁寧に解説
繰り返し発生する作業を本書で自動化して仕事を効率化しましょう!!

リンク

Toplist

最新の投稿

タグ