プロジェクト詳細
レシート分類・マッチングシステム
明細書とレシートの自動照合による、より迅速で正確な税務申請ワークフロー。
エグゼクティブサマリー
課題
クレジットカード明細とレシートの照合を手作業で行っていたため、会社の税務申告前に遅延と分類の不一致が発生していました。
解決策
無料LLMを使うGemini Colabワークフローを構築し、明細行とレシートを照合した上で、曖昧性を考慮したベンダー処理で取引分類を行いました。
成果
照合を高速化し、税務向けの経費分類品質を高める再現可能なレビュー工程を実現しました。
ユースケース・関係者
財務・業務チームは、手動レビュー時間を増やさずに、月次取引の信頼できる照合と分類を必要としていました。
- 財務オペレーションアナリスト
- 経理担当および税務準備担当
- 経費申請を行う事業部マネージャー
アーキテクチャ
明細行とレシートテキストを正規化し、候補マッチをスコアリングした後、曖昧なベンダーをLLM支援分類に回して最終レビューに接続します。
[クレジットカード明細 CSV/PDF]
|
OCR + 正規化
|
候補マッチのスコアリング
|
ベンダーが曖昧? -> LLM分類器
|
人手レビューキュー + エクスポート
技術詳細
RAG / プロンプト設計
- ベンダー名と加盟店コンテキストのヒントを使った曖昧性解消プロンプト。
- カテゴリラベルと信頼度を返す構造化出力テンプレート。
- モデル信頼度が低下した場合の軽量フォールバックルール。
使用ツール
- Gemini Colabノートブック実行環境
- Pythonによるデータクレンジングと照合ロジック
- 分類支援のための無料LLMエンドポイント
制約
- レシート品質のばらつきとOCRノイズ。
- 加盟店別名や明細説明の省略表記。
- モデル/API利用予算の制約。
トレードオフ
- 再現率を高める照合は、境界ケースで誤検出を増やす可能性がある。
- 分類自動化を強めるほど手作業は減るが、監査チェックを厳密にする必要がある。
スクリーンショットギャラリー
学びと次の改善点
学び
- 信頼度しきい値とレビューキューは、財務業務での信頼確保に不可欠。
- 加盟店別名辞書は初期照合品質を大幅に改善する。
- プロンプトスキーマの厳格化は後段の解析不具合を防ぐ。
次に改善したい点
- レビュー修正を取り込むアクティブラーニングループを追加する。
- レシート欠落を検知する文書レベル異常検知を追加する。
- カテゴリ別・ベンダー種別の月次品質スコアカードを追加する。
再現メモ / デモ手順
公開デモ(非実行)です。以下の手順で確認してください。
- ノートブックフローを開き、明細/レシートのサンプル入力を確認する。
- マッチングスコアロジックと曖昧性分類プロンプトを確認する。
- 例外ルーティング結果と最終分類エクスポート形式を確認する。