Sustainability Analyzer
ESGレポートをAIで分析 — トピック発見、定性評価、企業間比較表を自動生成
PythonPostgreSQLpgvectorBGE-M3ClaudeDocling

Overview
企業ESGレポートPDFを解析し、AIで体系的な定性評価を行う分析パイプライン。 Doclingレイアウトパーサーで表・テキスト構造を保持したまま階層的にチャンキング。BGE-M3エンベディング(Dense+Sparse)でハイブリッドセマンティック検索。Claudeが41のESGトピックを自動発見し、415のチェックリスト項目で定性評価を実施。 ローカルエンベディング+無料API基盤。PostgreSQL+pgvectorに構造化保存。
Features
📄
PDF構造保存パーシング
Doclingレイアウトパーサー — 表・セクション境界を保持した階層チャンキング
🔍
ハイブリッド検索
BGE-M3 Dense+Sparseエンベディング — pgvectorハイブリッドセマンティック検索
🗂️
トピック自動発見
Claude Sonnet — ESGレポートから41トピック・415チェックリスト自動生成
📊
AI定性評価
トピック別チェックリスト基盤の自動評価 — 根拠引用・スコア・コメント
⚖️
企業間比較表
セクター別フィルタリング — トピック×企業マトリクス自動生成
⚡
ローカル+無料
BGE-M3オンデバイスエンベディング、Claude・Gemini無料ティア活用
Architecture
Stack
🐍Python 3.12
🐘PostgreSQL 17
🧮pgvector 0.8
🔤BGE-M3
🧠Claude Sonnet
📄Docling
🔥PyTorch
🐳Docker Compose
📊Jinja2