レシートが溜まっているのに、確定申告が近づくほど手を付けにくくなる。これが一番危ない状態です。
焦って一気に片付けようとして、アプリを乗り換えて、設定をいじって、結局どこにも集計されない。そういう失敗が一番多いと感じます。
この記事では、レシート処理を「読み取り(OCR)→仕分け→保存→集計」まで一気通貫で回すためのロードマップを、完成図、最小構成、動くチェックリストで整理します。
法律や要件の部分は断定せず、国税庁や会計ソフト公式FAQの確認手順を必ず置きます。🙏
結論:自動化の完成図(最短ルート)
完成図はシンプルです。レシートが入ってきた瞬間に「データ化され、同じルールで分類され、探せる場所に保存され、集計の箱に入る」状態を作ります。
ここで重要なのは、完璧な自動化よりも「詰まらない自動化」です。
最短ルートは次の5箱で考えます。
入力(写真/スキャン/メール)→抽出(OCR)→整形(項目を揃える)→保存(検索できる形で保管)→集計(会計/スプレッドシート)→通知(人が確認するための合図)
最初から高機能にしない方が、結果的に早いです。まずは「保存と集計が必ず残る」最小構成を作り、次に仕分けを賢くします。😊
まず決める3点(保存先・分類軸・確認頻度)
レシート自動化で最初に決めるべきは、ツールではありません。保存先、分類軸、確認頻度の3つです。
ここが曖昧だと、OCRが当たっても仕分けで崩れ、最後に集計できません。
保存先は「探せる」「消えない」「権限が管理できる」場所が基本です。クラウドストレージでもローカルでもよいですが、途中で分散すると破綻します。
電子取引データの保存を含め、検索性をどう担保するかは後述の確認手順で詰めます。
分類軸は、最初は少ない方が回ります。例えば「交通/飲食/消耗品/通信/外注/その他」程度でも十分です。
分類を細かくするのは、集計の使い方が固まってからで遅くありません。
確認頻度は「毎日やる」ではなく「壊れない頻度」にします。おすすめは週1回10分か、月2回30分です。
この頻度を前提に、通知と未処理の溜まり方を設計します。
OCRのコツ(撮影/画像整理/ミスを減らす)
OCR精度は、ツール差より撮り方の差が出ます。ここを舐めると、あとで人間の修正が増えて自動化の意味が消えます。
コツは、毎回同じ条件で撮ることです。
まず撮影は「明るい場所」「影を入れない」「斜めを避ける」「文字が潰れない距離」を固定します。長いレシートは折らずに、可能ならアプリの長尺スキャン機能を使います。
ぐちゃぐちゃのレシートは、撮影前に一度伸ばすだけで誤読が減ります。
次に画像整理です。自動化の入口で一番効くのは「重複を作らない」ことです。
撮り直しをしたら古い方は捨てる、同じレシートが2回入る状況を作らない。これだけで、後段の突合が楽になります。
最後にミスを減らすための前提です。OCRは、日付、金額、店名、税区分あたりでズレます。
ズレる前提で「人が見る項目」を固定し、そこだけ直す運用にします。詳しくは後半のチェックで扱います。
ワークフローの基本設計(入力→抽出→整形→保存→通知)
ここからが本題です。自動化ワークフローは、どのツールでも考え方は同じです。
入力、抽出、整形、保存、通知を分けて、壊れた箇所を切り分けられる形にします。
最小構成(まず動く版)
最小構成は「スマホで撮る→OCRに通す→保存先に入れる→集計に残す→確認の印をつける」です。
この段階では、仕分けは雑でも構いません。重要なのは、必ず集計の箱に入ることです。
たとえば会計ソフトの取込機能を使う場合、ファイルボックスに入れてOCRで項目を起こし、未登録をまとめて確認して登録します。
この「未登録を定期的に潰す」運用ができれば、確定申告前の爆発を止められます。
一気通貫(n8n / Makeでつなぐ版)
n8nやMakeのような自動化ツールを使うなら、入口を統一するのがコツです。
おすすめは「特定フォルダに画像が入ったら開始」か「特定アドレスに転送された添付ファイルで開始」のどちらかです。
抽出(OCR)では、OCR結果をそのまま使わず、一度「整形」します。
整形とは、日付の形式を揃える、金額を数値にする、税区分やインボイス関連の有無を別項目にする、といった“後工程が扱える形”への変換です。
保存は「原本画像」と「抽出データ」を分けて残します。原本は監査や見直しで必要になりがちなので、必ず残します。
通知は、毎回通知すると無視されるので、例外だけ通知する設計にします。例えば「金額が一定以上」「日付が取れない」「カテゴリ不明」が出たときだけです。
“仕分け”を楽にするルール(カテゴリ辞書・例外処理)
仕分けの勝ち筋は「カテゴリ辞書」と「例外処理」です。ここを作ると、レシート処理が一気に回り始めます。
カテゴリ辞書とは「店名や決済先の文字列からカテゴリを推測するルール集」です。
最初は、上位20件の店名だけで十分です。交通系、コンビニ、通販、通信、サブスク、いつも行く飲食店。
この20件を辞書に入れるだけで、全体の半分以上が自動で決まることが多いです。
例外処理は、ルールを増やすより先に作ります。
具体的には「店名が曖昧」「金額が小さすぎる」「同じ店名でも用途が分かれる」などのケースを“人間確認”に逃がします。
もう一段楽にするなら、辞書は「カテゴリ」だけでなく「勘定科目」や「税区分の候補」まで持ちます。
ただし、税区分やインボイスの扱いは状況で変わるので、ここは必ず人間確認ポイントに残しておくのが安全です。
最後に必ずやるチェック(人間の確認ポイント)
自動化が回っている人ほど、人間が見る点を絞っています。
おすすめは次の3点だけ固定することです。
1つ目は日付です。日付がズレると集計期間が崩れます。
2つ目は金額です。小数点や桁落ちが起きると、後で見つけるのが難しくなります。
3つ目は取引先です。店名が取れない場合、辞書が効かず分類が崩れます。
この3点がOKなら、カテゴリが多少ズレても、確定申告直前に修正できます。
逆に、この3点が崩れていると、修正のために原本を延々と見返すことになります。
電子保存や要件面の確認は、個別事情で変わります。
ここは「国税庁の特設サイトとQ&Aで、スキャナ保存・電子取引の区分と要件を確認する」「不安が残る場合は税理士に条件を伝えて確認する」という順で進めます。
よくある失敗と復旧(途中で壊れた時の切り分け)
自動化は必ず途中で壊れます。壊れたときに詰まないために、最初から切り分け手順を決めておきます。
ポイントは、原因を「入力」「抽出」「整形」「保存」「集計」「通知」のどこで止まったかで分けることです。
よくあるのは、入力は入っているのにOCRが動かないケースです。これはAPI制限や認証切れが多いです。
次に多いのは、OCRは動くのに整形で落ちるケースです。日付形式の揺れ、金額にカンマが混じる、通貨表記が混ざるなどが原因になります。
保存で壊れるのは、フォルダ権限やファイル名規則が原因になりがちです。
電子取引データの検索性を意識してファイル名を規則化している場合、規則が崩れると後で探せなくなります。
復旧の基本は「原本画像を失わない」ことです。
原本が残っていれば、最悪でも手作業で再入力できます。原本が消える設計だけは避けます。
最後に、継続運用のコツです。
月1回、未処理ゼロを作る日をカレンダーに固定し、辞書を上位20件だけメンテします。これだけで、次の月がかなり楽になります。✍️
まとめ:今日やる手順(10分で着手して、明日から回す)
今日やることは多くありません。保存先、分類軸、確認頻度を決めます。次に、最小構成で「必ず集計に残る」流れを作ります。
そして、日付・金額・取引先の3点だけは人間が必ず確認します。
この型ができたら、n8nやMakeで自動化を広げていけば十分です。
関連記事として「n8n vs Make 比較」「OCR精度と失敗対策」も合わせて読むと、次の改善ポイントがはっきりします。


コメント