前回に引き続き、4月に参加した国際カンファレンス”Enterprise Data World”(以下EDW)についてご報告します。
20年前のEDWでは、多くのセッションが「データモデリング」をテーマにしていました。リレーショナルデータベース(RDB)にデータを格納し、SQLで操作するためには、あらかじめデータ構造が決まっていなくてはいけません。そのため、ビジネスに必要なデータの関係をデータモデリングするニーズが高く、そのノウハウがカンファレンスで共有されていたのですが、NoSQLデータベースが浸透してきたこの10年の間に、データモデリングのセッションは減ってしまいました。
データ構造を固めなくてもデータを格納して貯めていけるNoSQLは、Webを中心としたシンプルなビジネスで数多く採用されています。テキストも画像も音声も動画も、なんでも構造を意識せずNoSQLデータベースに格納し、必要なものを必要な時に見つける運用が広まりました。その結果、ER図を中心としたデータモデリングへの関心も下がっていました。
これまでは・・・
しかし、今年のEDWの多くのセッションでは、「NoSQLのためのデータモデリング」がテーマとして取り上げられていました。多くの企業がNoSQLにさまざまなデータを格納し続けた結果、その容量はテラ、ペタを越えつつあります。クラウドをはじめ、ストレージが安くなったとは言え、データ構造を整理・可視化して重複・冗長を排除しなければ、コストがばかにならなくなってきています。
また「機械学習とAIを使ってビッグデータを活用する」ためにも、データ構造の整理と可視化が必要とされています。インプットデータが画像であれば、その画像が何かを表すためのタグが振られ、別のタグとの意味関係が整理されている必要があります。20年前は「データの構造設計→格納→活用」の流れで必要だったデータモデリングが、現在では「データの格納→構造の発見→活用」という流れの中で必要とされているのです。
弊社セッションでも、「データ総研の概念データモデリングはNoSQLで使用できるのか」という質問がでました。
「もちろん、弊社のデータモデリングはデータ構造の発見にも貢献します。」
と答えさせていただきました。
実際、IoTや、AI基盤のインプットデータ構造の整理などの案件でも弊社のTH記法は活躍しつつあります。30年以上の歴史に裏打ちされたデータモデリングの活躍の場は今後も増えそうです。