EDINET 有報データベース
日本の全上場企業の財務データを横断的に分析できる構造化データベース
このデータベースは何か
金融庁のEDINET(Electronic Disclosure for Investors' NETwork)に提出された有価証券報告書から、財務データを自動で抽出・名寄せ・構造化したデータベースです。
有価証券報告書のXBRLデータは会計基準ごとに要素IDが異なり、企業独自の拡張IDも混在します。本システムはこれらを統一的な項目名に名寄せし、企業間・年度間で直接比較できる形に変換します。
毎朝8:00に自動更新。新規提出された有報を取得し、パイプラインを実行
データの範囲
対象書類
- 有価証券報告書(年次)
- 訂正有価証券報告書
四半期報告書は将来対応
会計基準
- JP GAAP: 3,538社(92.1%)
- IFRS: 295社(7.7%)
- US GAAP: 8社(0.2%)
更新頻度
- 財務データ: 毎日8:00 JST
- 企業マスタ: 毎月1日 7:00 JST
取得している財務指標
損益計算書
貸借対照表
投資指標
配当・株式
キャッシュフロー
加えて営業利益率・純利益率・ROA・FCF等の算出指標も自動生成。詳細は指標リファレンスを参照。
データカバレッジ(FY2024実績)
| 指標 | 取得社数 | 全体 | カバレッジ | 備考 |
|---|---|---|---|---|
| 売上高 | 3,265 | 3,841 | 85.0% | NULL = 保険HD、バイオ等 |
| 営業利益 | 3,142 | 3,841 | 81.8% | PL本表から取得 |
| 当期純利益 | 3,274 | 3,841 | 85.2% | |
| 総資産 | 3,275 | 3,841 | 85.3% | |
| 全指標NULL | 566 | 3,841 | 14.7% | 有報未提出企業 |
残りの14.7%は有価証券報告書が未提出の企業(新規上場、決算期の関係等)。有報が提出され次第、日次バッチで自動取得されます。
BigQueryデータベース構造
GCPプロジェクト edinet-database 上のBigQueryに3層構造で格納されています。
| レイヤー | テーブル | 行数 | 内容 |
|---|---|---|---|
| Bronze | documents | 15,566 | 書類メタデータ(提出日・会社・書類種別) |
| financial_csv | 6,434,992 | XBRL全要素(element_id × context_id × value) | |
| text_blocks | 780,629 | テキストブロック(事業リスク、MD&A等) | |
| Silver | companies | 4,399 | 企業マスタ(業種・証券コード・会計基準) |
| standardized_financials | 325,415 | 名寄せ済み財務データ(ロング形式) | |
| Gold | agg_financials | 19,219 | ピボット済み財務(企業×年度、24カラム) |
| agg_ratios | 19,219 | 算出済み財務比率(営業利益率・ROE・FCF等) |
提供形態
企業一覧・詳細・比較画面。検索・フィルタ・チャート付き。IAP認証でアクセス制御。
SQLで自由にクエリ可能。Gold層を使えば企業間比較、セクター分析、スクリーニングに対応。
想定ユーザーと活用シーン
目的: 取引先の財務健全性を素早く把握する
見る指標: 自己資本比率、営業CF安定性、FCF、純資産推移、営業利益率
ダッシュボード機能: 企業詳細ページの「財務健全性」タブでスコアと注意フラグを自動判定
目的: 上場企業の主要財務指標を整理し、トレンドと水準を把握する
見る指標: PER、ROE、EPS推移、配当性向、CFパターン、特別損益の影響
ダッシュボード機能: 企業詳細ページの「主要財務指標」タブで指標のトレンド・水準を整理
目的: 同業他社と自社のポジショニングを把握し、中期経営計画やIR資料の根拠とする
見る指標: 営業利益率の業界内順位、ROE vs 東証基準、配当性向の適正水準
ダッシュボード機能: 企業詳細ページの「ベンチマーク」タブで強み・課題・改善提案を自動提示
目的: 自社の分析ツールやAIサービスにEDINETデータ基盤を組み込む
利用形態: REST API(/v1/)、MCP Server(/mcp)、BigQuery直接アクセス
カスタマイズ: 顧客ごとに見たいパラメータ・計算ロジックが異なるため、共通DB+個別ビュー構成