近年、世界的にDX(デジタルトランスフォーメーション)への関心が高まっており、それと同時にデータマネジメントの重要性が認知されるようになってきました。データマネジメントとは文字通り、会社・組織の資産である「データを管理すること」です。
では、資産であるデータを管理するには、何が必要でしょうか。最初に思いつくのは、実際に入力されたデータの中身の管理かと思います。しかし、それだけではデータマネジメントは成り立ちません。データマネジメントの目的の1つは、データが安心して使えるようになることです。そのデータを誰が作成し、どのような経路をたどり連携されてきたかといったデータの素性や、そのデータに必要な項目がすべて正しい値で、もれなく入力されているのかといったデータ品質が示されていなければ、安心してデータを使うことはできません。このようなデータの素性やデータ品質を表すデータを「メタデータ」といいます。
メタデータは、データマネジメントの中で重要度の高いものですが、一般的な認知度はあまり高くないように感じます。今回はメタデータをテーマに、メタデータとはどんなもので、メタデータを管理する必要性はなにか、などをテーマに解説します。
『「実データ」と「メタデータ』』の関係は、『「本」と「本の周辺情報」』に似ています。例えば、読みたい本があって図書館に行ったとします。図書館には大量の本があり、その中から読みたい本を探す必要があります。しかし、むやみに図書館を歩き回って読みたい本を探しても、なかなか見つけることができません。その本の「作者」や「出版社」、などを蔵書の検索機にかけて、本がしまわれている「場所」を特定したうえで、本を探しに行く方が効率的です。
また、実際に本を見つける前後で、その本が実際に読む価値があるのか(本当に読みたい本なのか)を調べる方も多いのではないでしょうか。本の著者の経歴を見て判断する場合もあれば、知りたいことがしっかり記載されているかを、本の「レビュー」や「概要説明」、「目次」を確認する方もいらっしゃると思います。
このように、読みたい本を探すには、本に関する様々な周辺情報を参考にすると思います。実データに関しても、上記の例と同じことが言えます。何かのデータを見たい場合、データの周辺情報を頭に思い浮かべて、あるいはその知識を持っている人に聞いてデータを探しに行くことになります。
メタデータの例を挙げてみると、データ作成者、連携元システム(どのシステムからデータを連携されてきたのか)など、データが生まれてどのような経路をたどってきたのかを表すデータや、データの業務領域、データの格納場所、データ定義など、データの紹介をするためのデータや、データ品質のようにデータを評価するデータなどがあります。これらの項目を管理することで、社内のデータをより信頼度の高いものとして扱うことができるようになります。
このようにメタデータとは、「データそのものを管理するためのデータ」であり、メタデータを知ることで、利用者は安心かつ便利に社内のデータを活用できるようになります。
では、なぜメタデータを管理する必要があるのでしょうか。メタデータ管理におけるメリットを3点見ていきたいと思います。
今までご紹介したメタデータは専用のツール「データカタログ」で管理することができます。データカタログでは、メタデータの管理のほか、データの検索や、データ定義の閲覧をすることができたり、ツールによっては、そのデータを利用した人からの評価やコメントなどを閲覧することもできます。(データを商品としたネット通販サイトのようなイメージです。)
様々なデータカタログツールが販売されていますが、基本的な機能としては、メタデータの管理・閲覧であり、大きな違いはありません。ツールの導入に際しては、どのツールを導入するか以上に、どのような管理体制・ルールを設けるかが重要です。
ある企業では、業務の属人化が課題になっており、業務知識を共有することができていない状態でした。業務に関する確認は、特定の人物に問合せすることでしか行うことができず、問合せの回答が得られるまでに時間がかかることもあり、その間業務が一時的に滞るなどの問題点がありました。また、問合せを受ける側としても、多くの業務時間を問合せの回答時間に充てることになっており、業務効率の観点から問題視されていました。
そこで、メタデータ管理を実施し、業務用語や業務データの定義などを行うようにしました。その結果、業務知識の集約をデータカタログ上に集約できるようになり、問い合わせ件数が減少し、業務の効率化につなげることができるようになりました。
メタデータを管理するメリットや、メタデータによる業務改善の実践例について述べてきましたが、逆にメタデータ管理をしないと下記のような事態が起こると考えられます。
データマネジメント活動全般に言えることですが、メタデータの管理は、それ自体が直接利益を生み出す活動ではありません。ですが、メタデータの管理によって、業務の効率化を図り、かかるコストを低減することができます。また、実データの品質の向上は、データ活用(分析)結果の向上に直結します。せ、品質の高い分析結果から、より正しく業務上の意思決定をすることを通じて、企業全体の利益に寄与することができるようになります。
メタデータ管理の実践は、難しい部分もあります。例えば、データカタログに業務知識の集約をする際には、一時的に業務担当者の時間を使うことにつながりますし、データ品質の向上も、一朝一夕にはいかず、絶えず監視を行い、時には指標の見直しを行いながら、長い時間をかけて育てていくことが必要になります。
ですが、メタデータ管理自体は、どのような企業・組織であっても(特に規模が大きければ大きいほど)必要になってきます。メタデータ管理の道のりは長く、険しいものですが、まずは、メタデータを知るところから始めて、ゆくゆくは安心してデータ活用ができるメタデータを作り上げていきましょう。
メタデータ管理に不可欠となるデータモデリングを初歩から学べる研修コース「データモデリング スタンダードコース 入門編」。これまで延べ15,000人以上もの方々がデータ総研のデータモデリング教育コースを受講しています。
本セミナーでは、まずデータマネジメントの全体像を紹介し、
なぜデータモデリングが基礎スキルなのかを解説します。
さらにデータモデルの種類とデータモデルが必要な場面について事例を交えて紹介し、
最後に当社の“実務で使えるデータモデリングの技法”が得られるデータモデリング教育コースの特徴とコース内容をご案内します。