Sustainability Analyzer

ESGレポートをAIで分析 — トピック発見、定性評価、企業間比較表を自動生成

PythonPostgreSQLpgvectorBGE-M3ClaudeDocling

Overview

企業ESGレポートPDFを解析し、AIで体系的な定性評価を行う分析パイプライン。 Doclingレイアウトパーサーで表・テキスト構造を保持したまま階層的にチャンキング。BGE-M3エンベディング(Dense+Sparse)でハイブリッドセマンティック検索。Claudeが41のESGトピックを自動発見し、415のチェックリスト項目で定性評価を実施。 ローカルエンベディング+無料API基盤。PostgreSQL+pgvectorに構造化保存。

Features

📄

PDF構造保存パーシング

Doclingレイアウトパーサー — 表・セクション境界を保持した階層チャンキング

🔍

ハイブリッド検索

BGE-M3 Dense+Sparseエンベディング — pgvectorハイブリッドセマンティック検索

🗂️

トピック自動発見

Claude Sonnet — ESGレポートから41トピック・415チェックリスト自動生成

📊

AI定性評価

トピック別チェックリスト基盤の自動評価 — 根拠引用・スコア・コメント

⚖️

企業間比較表

セクター別フィルタリング — トピック×企業マトリクス自動生成

ローカル+無料

BGE-M3オンデバイスエンベディング、Claude・Gemini無料ティア活用

Architecture

Stack

🐍Python 3.12
🐘PostgreSQL 17
🧮pgvector 0.8
🔤BGE-M3
🧠Claude Sonnet
📄Docling
🔥PyTorch
🐳Docker Compose
📊Jinja2