heygoodの情報収集と品質管理の方法論
heygoodの企業情報ページは、求職者が転職・就活の意思決定に使えるレベルの正確性と透明性を目指して作られています。このページでは、データの収集から公開までのプロセスを説明します。
データソース
heygoodが使用するデータソースは、すべて企業が法定義務または自主開示として公開している一次情報です。
有価証券報告書(有報) は各企業ページの最も重要なデータソースです。金融商品取引法に基づき上場企業が年1回提出する法定開示書類で、事業概要、従業員データ(平均年齢・平均勤続年数・平均年間給与)、セグメント別業績、人的資本情報などを含みます。EDINETを通じて取得しています。
決算短信 は四半期ごとの業績データの主要ソースです。売上高、営業利益、各種利益率の実績値と進捗を取得しています。
中期経営計画・決算説明資料 は企業の戦略方向性を理解するために使用しています。企業によって開示形式が異なるため、中期経営計画を公表している企業はそれを、公表していない企業は決算説明資料から戦略要素を抽出しています。戦略開示資料がない企業にはその旨をページ上で明示しています。
heygoodでは、転職サイトの口コミや推測値は使用していません。すべての数値と事実の記述は上記の一次情報に根拠を持っています。
データ抽出プロセス
企業情報ページのデータは以下のプロセスで抽出・構造化されています。
まず、EDINET APIを通じて有価証券報告書のXBRLデータを取得します。XBRLは財務データの国際標準フォーマットで、売上高・営業利益・従業員数・平均年収などの定量データを正確に抽出できます。PDFからの手動転記に比べて転記ミスのリスクが大幅に低減されます。
次に、有報・中計・決算短信のPDFから事業説明、戦略テーマ、人的資本方針などの定性情報を抽出し、構造化JSONに変換します。この段階で「有報に書かれている事実」と「分析者の解釈」が混ざらないよう、情報の出所を明確にしています。
抽出されたデータは企業ごとに統合され、7つのセクション(会社の要約、事業構造、顧客像、戦略方向、戦略の背景、業績と環境、働き方)それぞれに対して構造化データを生成します。
品質管理
heygoodでは、2段階のバリデーションとヒューマンレビューを組み合わせた品質管理を行っています。
第1段階: スキーマバリデーション では、すべての生成データがJSON Schemaに準拠しているかを機械的に検証します。必須項目の存在、データ型、配列の要素数、文字数の範囲、enumの一致を自動チェックします。スキーマに違反するデータは公開されません。
第2段階: エディトリアルバリデーション では、スキル固有のビジネスルールを検証します。たとえば、エビデンス(情報源)が2つ以上あるか、比較ページの数値テーブルの欠損行が閾値以下か、企業名が正式名称と一致しているか、などのルールを適用します。
ヒューマンレビュー はすべてのページを公開前に実施します。ソースの正確性、主張の裏付け、数値の整合性を確認し、問題があれば修正または公開を見送ります。
品質スコアが基準を下回るページには `noindex` を設定し、検索エンジンにインデックスさせません。具体的には、エビデンス数が3未満、比較テーブルの欠損行が半数以上、品質スコア80点未満のいずれかに該当する場合です。
更新頻度
企業の有価証券報告書は年1回(通常6月〜9月)、決算短信は四半期ごとに更新されます。heygoodの企業情報ページは、これらの法定開示に合わせて更新しています。
各ページの `updated_at` フィールドに最終更新日を記載しています。また、各ページの末尾「このページの情報源」セクションで、使用しているデータソースの提出日・対象期間を確認できます。
限界と注意点
heygoodの企業情報ページには以下の限界があります。
予想値は原則として使用しません。 SEOスニペットや要約セクションで表示する数値は直近確定実績(通期決算)のみです。将来性に関する記述で予想値に言及する場合は「予想」「計画」と明記しています。
非開示項目は「—」と表記します。 男性育休取得率、有給取得率、離職率など、企業が開示していない項目は推定値を作らず、未開示であることを明示します。
IR資料に記載のない情報は補完しません。 口コミ、推測、一般的な業界傾向による補完は行いません。結果として、IR開示が充実している企業ほど情報量が多くなる傾向があります。
企業の公式見解を代弁するものではありません。 heygoodのページは公開情報の分析であり、企業の公式見解や推奨を意味しません。転職・就活の意思決定は、ここでの情報を出発点として、企業の公式サイトや面接を通じてご自身で判断されることをお勧めします。
お問い合わせ
データの誤りや改善のご提案がありましたら、お気軽にお問い合わせください。正確性の向上に継続的に取り組んでいます。