プロジェクト詳細

レシート分類・マッチングシステム

明細書とレシートの自動照合による、より迅速で正確な税務申請ワークフロー。

  • ドキュメントAI
  • 経費業務
  • 分類

エグゼクティブサマリー

課題

クレジットカード明細とレシートの照合を手作業で行っていたため、会社の税務申告前に遅延と分類の不一致が発生していました。

解決策

無料LLMを使うGemini Colabワークフローを構築し、明細行とレシートを照合した上で、曖昧性を考慮したベンダー処理で取引分類を行いました。

成果

照合を高速化し、税務向けの経費分類品質を高める再現可能なレビュー工程を実現しました。

ユースケース・関係者

財務・業務チームは、手動レビュー時間を増やさずに、月次取引の信頼できる照合と分類を必要としていました。

  • 財務オペレーションアナリスト
  • 経理担当および税務準備担当
  • 経費申請を行う事業部マネージャー

アーキテクチャ

明細行とレシートテキストを正規化し、候補マッチをスコアリングした後、曖昧なベンダーをLLM支援分類に回して最終レビューに接続します。

[クレジットカード明細 CSV/PDF]
           |
   OCR + 正規化
           |
  候補マッチのスコアリング
           |
ベンダーが曖昧? -> LLM分類器
           |
  人手レビューキュー + エクスポート

技術詳細

RAG / プロンプト設計

  • ベンダー名と加盟店コンテキストのヒントを使った曖昧性解消プロンプト。
  • カテゴリラベルと信頼度を返す構造化出力テンプレート。
  • モデル信頼度が低下した場合の軽量フォールバックルール。

使用ツール

  • Gemini Colabノートブック実行環境
  • Pythonによるデータクレンジングと照合ロジック
  • 分類支援のための無料LLMエンドポイント

制約

  • レシート品質のばらつきとOCRノイズ。
  • 加盟店別名や明細説明の省略表記。
  • モデル/API利用予算の制約。

トレードオフ

  • 再現率を高める照合は、境界ケースで誤検出を増やす可能性がある。
  • 分類自動化を強めるほど手作業は減るが、監査チェックを厳密にする必要がある。

スクリーンショットギャラリー

学びと次の改善点

学び

  • 信頼度しきい値とレビューキューは、財務業務での信頼確保に不可欠。
  • 加盟店別名辞書は初期照合品質を大幅に改善する。
  • プロンプトスキーマの厳格化は後段の解析不具合を防ぐ。

次に改善したい点

  • レビュー修正を取り込むアクティブラーニングループを追加する。
  • レシート欠落を検知する文書レベル異常検知を追加する。
  • カテゴリ別・ベンダー種別の月次品質スコアカードを追加する。

再現メモ / デモ手順

公開デモ(非実行)です。以下の手順で確認してください。

  1. ノートブックフローを開き、明細/レシートのサンプル入力を確認する。
  2. マッチングスコアロジックと曖昧性分類プロンプトを確認する。
  3. 例外ルーティング結果と最終分類エクスポート形式を確認する。