生成AIでできることも多く、便利にはなりました。
ただ、それでも変わらずITスキルは磨いておきたいもの。
事例をもとに話してみます。
多すぎる情報
今回の事例は、PDFから必要なデータだけを抽出したいというもの。10/1〜1/31までの各空港の運賃表です。

1ページで1ヶ月の航空運賃をまとめているのでフォントが小さいし、39ページもありますからなかなか見る気になれません。
並び方も法則がわからず、ここ、名古屋発または名古屋着の料金を目視で探すのはタイヘンです。
やらないほうがいいでしょう。
そこで考えたいのは、必要なデータだけにすること。
PDFで検索すればいいのかもしれませんが、ひと目でぱっと確認できず、ネタにするべく次の2つを試してみました。
・生成AIで抜き出す
・Excelに変換して抜き出す
生成AIはうそをつく
PDFファイルをアップロードして、必要なデータだけを抜き出せればいいわけです。
そこで生成AIを使ってみようと思われるかもしれません。
ただ、これがなかなかうまくいかないのです。
さらっとうそを答えるからです。
生成AIはあることないことを自信を持って答えます。
その様子を見てみましょう。
まずはGeminiで。10月27日には該当データがないと言っています。

「いやいや、あるんだって。」
こんな感じで生成AIはしれっとうそをつきます。
ChatGPTはどうか?
PDFファイルをアップロードして、同じ質問をしてみました。データを抜き出してくれたのですが、ただ回答は一部だけ。

。「すべてを出しますか?」と聞かれて、またそこでお願いするのも二度手間。仕方なく質問をコピペして、返答。

ダウンロードしたデータを開くと、パッと見てよさそうなのですが、実は仙台、宮崎、大分などのデータが足りません。

もう1つ、GoogleのNotebookLMはどうか?
他の生成AIとはちょっと立ち位置が違って、こちらが提供したデータの範囲に限って回答してくれます。
PDFファイルをアップロードして、読み込んでもらったのを踏まえて、同じ質問をしてみると、

データのダウンロードはできません。そこで表示された表をコピーして、Excelに貼り付けてみると、

まぁ、今までの中ではいちばんよさそうですけど、やっぱり足りません…。

まぁ、だいたいわかればと思われるかもしれませんが、これが仕事に使うデータだと考えると、データのぬけもれがあってはいけませんからね。
PDFファイルをExcelに変換
ここでいったん仕切り直し。
今度はExcelで必要なデータを取り出してみましょう。
PDFファイルをExcelデータに変換することもできます。
変換の精度はそれほど高くないのですが。
ただ、状況によっては、やってみる価値もあります。
変換ソフトはネットでiLovePDFやAdobeのPDF変換ツールなどを利用してPDFをExcelに変換することもできます。
今回はAdobe Acrobat(有料)でやってみることに。
PDFファイルを開いて、「PDFを書き出し」をクリックし、

「Excel」を選び、「XLSXに変換」をクリックしてファイル保存します。

Excelに変換できたところで、オートフィルタで「名古屋発」と「名古屋着」を抽出すればいいわけですが、A6とB6のセルが「区間」として結合されています。

セルの結合は、やっちゃいけないのです。なので結合を解除して、それぞれのセルの項目も「出発」と「到着」に変えておきます。

PDFをExcelに変換するので、きれいなデータにはなかなかなりません。
金額欄に謎の空欄があったり、途中で空欄セルに金額が入っていたりします。こういうのを整理する処理は、今回のネタの本質ではないのでここではスルーします。

もとがPDFなのでいらないデータもたくさんあります。まずは11月以降1月までのデータ(ページ)をすべて削除、

各ページにある見出しと項目を、A列でオートフィルタ(Ctrl+Shift+L)で選んで行削除、

続けて、2ページ目以降の「項目列」も同様に行削除。

さらに10/27〜10/29の3日間以外の列データをすべて列削除。
すると、残ったのは10/27〜10/29の各空港のデータのみ。
ファイル保存をして閉じたあと、ChatGPTに「名古屋発着以外のデータを削除して」とお願いすると、瞬時にデータをつくってくれました。

ダウンロードしてチェックすると、名古屋発または着のデータ、10/27〜10/29までをとりだせました。
データが減れば精度も上がるでしょうから、これで大丈夫です。(たぶん)

このことにここまでやる必要があるかどうかといえばないのでしょうけど、データ整理のネタです。
情報が多すぎて、必要なデータだけを取り出したいということもあるでしょうから、そのトレーニングにはいいデータです。
生成AIもさらっと嘘をつくことも踏まえて、どこまでをお願いするか?
じぶんで手を動かしながら、考えてみるのもおすすめです。
「生成AIが言ったから」「生成AIが出した答えだから」とは言いたくありませんからね。
生成AIがあっても、ITスキルの基本が大事なのは変わりません。
【編集後記】
昨日はオフ。セミナー準備などを。
気温が気温だったので、自宅でほぼ1日。
子どもたちはお祭りで外出。
あの気温の中、さすがです。
【昨日の1日1新】
※「1日1新」→詳細はコチラ
SwitchBot下取りサービス