DRIブログ

メタデータとは?-意味・具体例・活用例を解説

データモデリング/メタデータ管理

データマネジメントの気流の高まりとメタデータ

近年、世界的にDX(デジタルトランスフォーメーション)への関心が高まっており、それと同時にデータマネジメントの重要性が認知されるようになってきました。データマネジメントとは文字通り、会社・組織の資産である「データを管理すること」です。

では、資産であるデータを管理するには、何が必要でしょうか。最初に思いつくのは、実際に入力されたデータの中身の管理かと思います。しかし、それだけではデータマネジメントは成り立ちません。データマネジメントの目的の1つは、データが安心して使えるようになることです。そのデータを誰が作成し、どのような経路をたどり連携されてきたかといったデータの素性や、そのデータに必要な項目がすべて正しい値で、もれなく入力されているのかといったデータ品質が示されていなければ、安心してデータを使うことはできません。このようなデータの素性やデータ品質を表すデータを「メタデータ」といいます。

メタデータは、データマネジメントの中で重要度の高いものですが、一般的な認知度はあまり高くないように感じます。今回はメタデータをテーマに、メタデータとはどんなもので、メタデータを管理する必要性はなにか、などをテーマに解説します。

 

メタデータの説明に入る前に…

『「実データ」と「メタデータ』』の関係は、『「本」と「本の周辺情報」』に似ています。例えば、読みたい本があって図書館に行ったとします。図書館には大量の本があり、その中から読みたい本を探す必要があります。しかし、むやみに図書館を歩き回って読みたい本を探しても、なかなか見つけることができません。その本の「作者」や「出版社」、などを蔵書の検索機にかけて、本がしまわれている「場所」を特定したうえで、本を探しに行く方が効率的です。

また、実際に本を見つける前後で、その本が実際に読む価値があるのか(本当に読みたい本なのか)を調べる方も多いのではないでしょうか。本の著者の経歴を見て判断する場合もあれば、知りたいことがしっかり記載されているかを、本の「レビュー」や「概要説明」、「目次」を確認する方もいらっしゃると思います。

このように、読みたい本を探すには、本に関する様々な周辺情報を参考にすると思います。実データに関しても、上記の例と同じことが言えます。何かのデータを見たい場合、データの周辺情報を頭に思い浮かべて、あるいはその知識を持っている人に聞いてデータを探しに行くことになります。

 

メタデータとは何なのか

メタデータの例を挙げてみると、データ作成者、連携元システム(どのシステムからデータを連携されてきたのか)など、データが生まれてどのような経路をたどってきたのかを表すデータや、データの業務領域、データの格納場所、データ定義など、データの紹介をするためのデータや、データ品質のようにデータを評価するデータなどがあります。これらの項目を管理することで、社内のデータをより信頼度の高いものとして扱うことができるようになります。
このようにメタデータとは、「データそのものを管理するためのデータ」であり、メタデータを知ることで、利用者は安心かつ便利に社内のデータを活用できるようになります。

image-png-Dec-12-2023-01-01-21-9182-AM

 

メタデータ管理の必要性

では、なぜメタデータを管理する必要があるのでしょうか。メタデータ管理におけるメリットを3点見ていきたいと思います。

  1. 欲しいデータがすぐに見つかる
    弊社コンサルタントが参画したプロジェクトの経験から、データ活用をする際にかかる時間の80%はデータの準備(データの収集および、利活用できる状態への加工)であるといえます。メタデータを管理することで、データの格納場所が明確になり、活用データの収集にかかる時間を大幅に短縮することができます。また、活用者視点だと、データを様々な角度から検索することができるようになり、利便性が向上します。
  2. セキュリティ面の向上
    近年、セキュリティの必要性がより声高に叫ばれるようになっています。不正アクセスやウイルス感染などの外部要因によるリスクや、人為的なミスによる機密データ漏洩などの内部要因によるリスクなど、さまざまなリスクを削減していく必要があります。こうしたセキュリティのリスクへの、メタデータによる対応は大きく2つあります。
    1つ目は、アクセス権限の管理です。だれがどのデータを閲覧してよいのかを設定することで、内部要因による情報漏洩のリスクを低減することが可能です。
    2つ目は、セキュリティレベル情報の管理です。万が一、セキュリティ侵害が起こった場合のリスクを予め評価しておくことで、各データに対して適切な対策を講じることができるようになります。例えば、顧客の個人情報は情報漏洩が起こった際のリスクが甚大であると想定できるので、閲覧権限を極々少数にしたり、個人を特定できないレベルまでマスキングをするなど、対策を講じることが考えられます。
  3. データ品質の向上
    入力されている内容が間違っていたり、そもそも値が入力されていなかったりすると、思うような分析結果が得られないことがあります。正しい活用結果を得るためには、データ品質の管理が必要不可欠です。以下で、データ品質の管理に必要な、データの評価軸を2つほど紹介します。
    1つ目はデータの完全性です。これは必要なデータがすべて存在するかを確認するための指標です。例えば、入力が必須になっている項目が入力されていないような場合、空白になっているデータの割合を算出します。もし、必須入力になっている項目が空欄になっている割合が高い場合は、業務担当者に改善するように指示を出すこともできるようになります。
    2つ目はデータの有効性です。これはデータに有効な値が登録されているかを確認するための指標です。例えばデータのある会社の社員データについて考えてみます。社員年齢の項目があり、そこに“200“という値が入力されている場合、明らかに間違った値が入力されているとわかります。社員の年齢が2桁の整数で登録されるようなルール(データの定義)になっていれば、システム側で間違っていることが判別できるようになります。

メタデータ管理ツール

今までご紹介したメタデータは専用のツール「データカタログ」で管理することができます。データカタログでは、メタデータの管理のほか、データの検索や、データ定義の閲覧をすることができたり、ツールによっては、そのデータを利用した人からの評価やコメントなどを閲覧することもできます。(データを商品としたネット通販サイトのようなイメージです。)

様々なデータカタログツールが販売されていますが、基本的な機能としては、メタデータの管理・閲覧であり、大きな違いはありません。ツールの導入に際しては、どのツールを導入するか以上に、どのような管理体制・ルールを設けるかが重要です。

 

メタデータ管理による業務改善

ある企業では、業務の属人化が課題になっており、業務知識を共有することができていない状態でした。業務に関する確認は、特定の人物に問合せすることでしか行うことができず、問合せの回答が得られるまでに時間がかかることもあり、その間業務が一時的に滞るなどの問題点がありました。また、問合せを受ける側としても、多くの業務時間を問合せの回答時間に充てることになっており、業務効率の観点から問題視されていました。
そこで、メタデータ管理を実施し、業務用語や業務データの定義などを行うようにしました。その結果、業務知識の集約をデータカタログ上に集約できるようになり、問い合わせ件数が減少し、業務の効率化につなげることができるようになりました。

 

メタデータ管理をしないとどうなるか

メタデータを管理するメリットや、メタデータによる業務改善の実践例について述べてきましたが、逆にメタデータ管理をしないと下記のような事態が起こると考えられます。

  1. 欲しいデータがすぐにみつからない
    データの格納場所が明示されていないので、データ活用の際、活用データの収集に大幅に時間をとられてしまいます。
  2. セキュリティリスクの増加
    セキュリティレベル情報の管理が複雑化する、ないしは可視化されていない状態になることで、適切なセキュリティリスクへの対応が行えない事態が生じる可能性があります。
  3. データ品質の低下
    データ品質が管理されていないことで、入力データの品質が下がり、またそれを向上させる策を講じるのも難しい状態になります。データの品質が下がることで、データ活用の結果の品質も下がり、業務上の意思決定を正しく行うことができなくなることも考えられます。
  4. 業務効率の低下
    業務知識が属人化し、担当者は問合せに追われ、利用者は問合せの回答を得るのに時間がかかることで、業務効率が低下することにつながります。

「メタデータ」に関するまとめ

データマネジメント活動全般に言えることですが、メタデータの管理は、それ自体が直接利益を生み出す活動ではありません。ですが、メタデータの管理によって、業務の効率化を図り、かかるコストを低減することができます。また、実データの品質の向上は、データ活用(分析)結果の向上に直結します。せ、品質の高い分析結果から、より正しく業務上の意思決定をすることを通じて、企業全体の利益に寄与することができるようになります。

メタデータ管理の実践は、難しい部分もあります。例えば、データカタログに業務知識の集約をする際には、一時的に業務担当者の時間を使うことにつながりますし、データ品質の向上も、一朝一夕にはいかず、絶えず監視を行い、時には指標の見直しを行いながら、長い時間をかけて育てていくことが必要になります。

ですが、メタデータ管理自体は、どのような企業・組織であっても(特に規模が大きければ大きいほど)必要になってきます。メタデータ管理の道のりは長く、険しいものですが、まずは、メタデータを知るところから始めて、ゆくゆくは安心してデータ活用ができるメタデータを作り上げていきましょう。

 

メタデータ管理に必須のデータモデリングスキルを習得

DMS_TOP_NEW-1

メタデータ管理に不可欠となるデータモデリングを初歩から学べる研修コース「データモデリング スタンダードコース 入門編」。これまで延べ15,000人以上もの方々がデータ総研のデータモデリング教育コースを受講しています。

データモデリング スタンダードコース 詳細はこちら

 

無料セミナー「データモデリング」セミナー

本セミナーでは、まずデータマネジメントの全体像を紹介し、
なぜデータモデリングが基礎スキルなのかを解説します。
さらにデータモデルの種類とデータモデルが必要な場面について事例を交えて紹介し、
最後に当社の“実務で使えるデータモデリングの技法”が得られるデータモデリング教育コースの特徴とコース内容をご案内します。

セミナー詳細はこちら

データ活用の初心者向け!
データ活用者のためのデータモデリングセミナー

本セミナーでは、データモデリング基礎的な知識/技術についてお話をします。
データ活用初心方はもとより、これからデータモデリングを勉強しようと思っているSE方にも最適な内容となっております。

メタデータ管理に必須のデータモデリングスキルを習得

DMS_TOP_NEW

メタデータ管理に不可欠となるデータモデリングを初歩から学べる研修コース「データモデリング スタンダードコース 入門編」。これまで延べ15,000人以上もの方々がデータ総研のデータモデリング教育コースを受講しています。

業務可視化に役立つデータモデルとプロセスモデル

システム開発を成功させるためには、システム化対象業務の流れ・必要な情報について、「関係者が齟齬なく理解できるように」可視化する必要があります。その際に役立つのが、データモデルとプロセスモデルです。そして、これらは貴重なビジネスメタデータとして扱われます。

本資料では、業務可視化の考え方、およびデータ総研で標準としているデータモデル・プロセスモデルの記法をご紹介しています。