データソース
原典データ
EDINET DB のデータは、金融庁が運営する EDINET から取得した有価証券報告書(XBRL形式、docTypeCode=120)を元にしています。 対象は全上場内国法人(約3,800社)です。
データパイプライン
Fetch(日次 8:00 JST)
EDINET APIから直近3日分の新規提出書類を取得。CSVデータ(type=5)をBigQueryに格納。
Transform(名寄せ)
141のelement_idを24の標準指標に名寄せ。JP GAAP / IFRS / US GAAPの3会計基準に対応。Layer 1(標準マッピング)+ Layer 2(正規表現フォールバック)の2層処理。
Aggregate(集計)
企業×年度のピボットテーブル作成。財務比率(ROE、営業利益率、自己資本比率等)を算出。
Analyze(分析)
ルールベースの信用・投資・ベンチマーク分析エンジンでスコアリング。Gemini 2.0 FlashによるAI総合所見を生成。
更新スケジュール
| ジョブ | 頻度 | 内容 |
|---|---|---|
| 有報取得+変換 | 毎日 8:00 JST | 直近3日分の新規提出書類を取得・名寄せ・集計 |
| AI所見生成 | 毎日 9:00 JST | 新規・更新企業のAI所見を差分生成 |
| 企業マスタ更新 | 毎月1日 7:00 JST | EDINETコードリスト(業種、証券コード、上場区分等)を更新 |
カバレッジ
| 指標 | カバー率 | 備考 |
|---|---|---|
| 売上高 | 99.8% | 保険HD等の特殊業種のみNULL |
| 営業利益 | 82.9% | 金融業等、XBRL上に標準要素がない企業はNULL |
| 純利益 | 100.0% | |
| 総資産 | 100.0% | |
| AI所見 | 100.0% | 全3,848社生成済み |
品質保証
売上高・営業利益・当期純利益について、上場企業上位20社(売上高基準)のIR開示値との完全一致を確認しています。 JP GAAP・IFRS・US GAAPの3会計基準を対象に検証済みです。