泡玉FEVER

すべてはうたかたのように。

保護されたPDFをExcelに変換

目的:PDFの表をEXCELにして請求明細を管理する。

 

目的詳細:AEON CARDの請求明細が(強制で)電子データに代わり、

     過去の請求書の履歴をまとめたいのでExcelにしようとして

     古いものがPDFでダウンロードできたのでEXCELで管理する。

 

ちなみに最新3か月はCSVでダウンロードできるのでExcelには容易に変換できた。

 

PDFの明細の表データをコピペしようとしたら、

一つのセルに全部張り付いて大変なことに。

Adobe Reader DCの機能でExcelにしようとしたらAdobe ReaderDCでできそうな。

早速やってみると

f:id:takamano:20191104220508p:plain

保護?

プロパティを見てみると

f:id:takamano:20191104220540p:plain

PDFに保護がかかっていてGoogle先生に2回目の問い合わせ

Chromeで印刷でPDF化すると保護は外れるよう。

印刷後変換してみる。

f:id:takamano:20191104220335p:plain

と、課金メニューがポップアップ。。。。

Readerでは出来ず、Acrobat(有料)でのみできるようなので

(マウスでお絵かき下手....)

f:id:takamano:20191104220240p:plain

お金払わないでと、

Google先生に今一度問い合わせしたら、どうやらフリーソフト入れたりと

面倒な・・・

 

とここでReaderでテキスト選んでペースとしてみると、

あら不思議

先ほどは1セルに全部張り付けされたものが、行で張り付けされた。

 

結論はChromeのPDF表示はコピーしても行認識されず

Readerでは行認識する。

 

このあとは列認識されなかったので、

列の文字を分割していけば、表の完成になるはず。

(☞区切り位置を用いて列を分割、全角数字を半角数字に変換する式などを用いて)