データレイク・データウェアハウス(DWH)・データマートそれぞれの違い、メリット・デメリットを紹介!

データレイク・データウェアハウス(DWH)・データマートそれぞれの違い、メリット・デメリットを紹介!

ビッグデータをはじめ、膨大かつ多様な情報が存在する現在、データを効果的に活用・分析することが企業には求められています。そこで重要になるのがデータ分析基盤の構築です。本記事では、データ分析基盤を構成するデータレイク・データウェアハウス(DWH)・データマートの特徴やメリット・デメリットをご紹介します。

現代において重要なデータ分析基盤構築

膨大な量の情報が存在する現代社会では、企業で取り扱うデータ量も急激に増加しています。また、データ量が増加しているだけではなく、ビッグデータをはじめ現代のデータにはさまざまな形態や大きさ、種類があり、そうしたデータをいかに分析・活用するかによって企業の成長が左右されるといわれています。

ビッグデータの効果的な分析・活用を実現するためには、データ分析基盤を構築することが重要です。データ分析基盤にはデータの収集・蓄積・活用というフェーズがありますが、以下では特に重要であるデータの蓄積(データレイク・データウェアハウス(DWH)・データマート)についてご紹介します。

あらゆるデータを蓄積する:データレイク

データレイクとは

データレイクとは、データの構造や大きさ、性質、種類などにかかわらず、あらゆるデータをそのままの形で集めて保存できる格納庫のことです。規則性を持つ構造化データや、文書や画像などの非構造化データを形にとらわれずに保存できる点が特徴です。
大量のデータが泳ぐことのできる「湖」(Lake)という意味合いから、データレイクと名付けられています。

データレイクのメリット・デメリット

データレイクのメリットとして、収集したデータを未加工の形で保管できることにより、データの一元管理が可能な点が挙げられます。構造化する手間がなく、瞬時にローデータ(生データ)を格納するため、コストをかけずに大量のデータを保存でき、かつ高速でのデータ処理や全社を横断したデータ共有が可能です。
柔軟性のあるローデータを保存でき、任意の目的で迅速に分析できるため、機械学習のシステムに応用するのが理想的です。

デメリットとして、データが未加工の状態で保管されているため、分析に工数がかかる場合があります。技術的な知識がない人にとっては使いにくく、誰もが簡単かつ自由に活用できるわけではない点には留意が必要です。

構造化されたデータを保管する:データウェアハウス(DWH)

データウェアハウス(DWH)とは

データウェアハウスは、基幹系システムなどから収集したデータを活用するための保管場所のことです。データレイクとは異なり、ローデータではなく処理済み、構築済みのデータを蓄積します。データウェアハウス内では、これらのデータがサブジェクトと呼ばれるまとまりごとに整理・保管されています。
あらゆるデータをそのまま保存するデータレイクとは異なり、さまざまなフォーマットのデータを分析しやすいよう集約・整理しているため、検索が容易な点が特徴です。

データウェアハウス(DWH)のメリット・デメリット

データウェアハウスのメリットは、データをすべて時系列順に保管できる点です。そのため、過去のどの時点で保存されたのか把握でき、分析に際して総合的な判断や的確な意思決定が可能です。

一方、データレイクと違い、あらかじめ決められた目的でしかデータを活用できないため、定型的な分析に陥りやすい点がデメリットです

目的や用途に沿って抽出する:データマート

データマートとは

データマートとは、データの利用部門や用途、目的などに応じて必要なものだけを抽出し、利用しやすい形に加工したうえで格納する場所を指します。情報が網羅的に格納されるデータウェアハウスとは異なり、データマートはデータを目的や用途ごとに小分けした「マート」(店)というイメージです。

データマートのメリット・デメリット

データマートは、目的や用途に沿って抽出・保管されているため、迅速かつ容易にデータを取り出せる点がメリットです。また、特定の情報の収集や分析を目的としているため、既存のデータウェアハウスをもとに簡単に作成できるメリットもあります。

一方、目的や用途によって抽出されたデータであるため、重層的・多角的な分析に向かない点はデメリットです
近年は顧客のニーズの変化が激しくなっており、データマートでは対応しきれなくなりつつあります。要件に合わせてデータマートの数が増えると、修正などに多くの手間やコストがかかってしまうからです。また、部門の要件ごとにデータマートを作成すると、データ活用の仕方が部門ごとに異なってしまう点もデメリットです。

データレイク・データウェアハウス(DWH)・データマートの関係性

データ分析基盤は、前述のデータレイク・データウェアハウス・データマートが段階的な層をなすことで構築されています
さまざまな形や性格・種類のローデータをそのまま保管する湖のような層がデータレイクであり、データレイク内のデータを分析しやすいように加工し、保管する層がデータウェアハウスです。そして、データウェアハウスに保管された情報のうち、目的や用途に沿って抽出したものを保管する層をデータマートと呼びます。これらを通じて段階的に収集→構造化→集計・集約・抽出することで、データは活用しやすくなります

データ分析基盤を単独で構築することは考えない。併用して行うことが重要

前述の通り、データレイク、データウェアハウス、データマートは3層構造となっており、データ分析基盤を支える重要な要素です。それぞれが密接に関連しているため、データ分析基盤を構築する際、これら3つの要素を単独で構築してしまうとメリットを十分に享受できません。それぞれを併用して統一的に基盤を構築し、データ活用につなげる必要があります。

データ分析基盤の構築のポイントについては以下リンクの記事で詳しく説明していますので、あわせてご覧ください。



ラキールが提供している「LaKeel Data Insight」では、データレイク、データウェアハウス(DWH)、データマートの3層を併用しながらデータ管理、構築、連携処理が可能です。蓄積されたデータは、技術的な特性を意識することなく簡単な操作で利用できるほか、データがカタログ化されているため、アクセスが容易でありながら強固なセキュリティを実現しています。

また、「LaKeel Data Insight」のデータはAPIで取り出せるため、レポート作成やAIなどさまざまなアプリケーションと連携が可能です。これによりサイロ化を回避し、効率の良いデータ活用が可能となります。

DXを支える統合データ基盤「LaKeel Data Insight」に関する詳細、お問合わせや資料請求については、以下のページよりお気軽にご相談ください。

データレイク・データウェアハウス(DWH)・データマートそれぞれの違い、メリット・デメリットを紹介!

お問合せ・資料請求

LaKeelシリーズの製品導入、販売に関するお問合せはお気軽にご相談ください。
LaKeel製品の導入・販売に関する
お問合せはこちら
お問合せ・ご相談
LaKeel製品の資料請求はこちら
 
資料請求はこちら