初心者でも簡単に出来るデータベース設計の全手順６ステップ

「データベース設計って何に気をつけてやれば良いんだろう？」「データベース設計の基本的な手順が知りたい」

こんなふうに思ったことはないだろうか。

筆者はエンジニア２年目の時に複数のデータベースのテーブル追加を伴う案件を任され、どのように進めるのが良いのかわからずかなり困惑した記憶がある。どう進めれば良いか全くわからず、結果として設計レビューではかなりの指摘を受けた。なんどもなんども修正とレビューを繰り返した記憶がある。

そのため、この記事では初めてデータベース設計をする方が同じような苦い経験をすることがないように、筆者が当時知っておきたかったことをまとめた。主にアプリケーション開発でメインになるデータベースの論理設計について話していく。

基本的なデータベースの設計手順としては以下の６段階だ。
１エンティティを洗い出す
２エンティティに項目を入れていく
３データの重複を排除する（正規化）
４エンティティ間の関連を定義する
５ビジネス要件を実現できるか確認する
６導出項目を排除する

このやり方をECサイトの例をもとに本文では紹介していく。

また、代表的なアンチパターンをその具体例となぜいけないのかについても説明する。それによって設計の勘所が少しでも見えてきてくれたら幸いだ。

では、実際に見ていこう。

１エンティティを洗い出す

まずはデータとして登録するエンティティを特定する。エンティティとはデータの集合のことである。

データベース設計においては、エンティティには以下の二つがある。
・イベント（ECサイトで言うと、注文、配送など）
・リソース（ECサイトで言うと、商品、ユーザーなど）

まずはイベントを洗い出し、その後にリソースを特定する流れが効率的だ。

続く章で詳しく説明していく。

１−１イベントを洗い出す

まずはイベントを洗い出す。ECサイトで言えば注文などの行動のことだ。

イベントを見分けるには、「いつ（タイムスタンプ）」を属性として定義できるかを検討するとわかりやすい。

なぜ最初にイベントを特定するかと言うと、漏れなく把握しやすいからだ。例えば業務内容をヒアリングする際も、やってること（イベント）を聞き出す方が、どんなもの（リソース）を扱ってるかを聞くより圧倒的に簡単だ。

エンジニアの業務で考えてみるとわかりやすい。使っているリソースはソースコード、GitHubなどのバージョン管理ツールや、チャットツールがあるかもしれない。しかし、それを網羅するのは難しい。それよりも、チケットを見て、コードの実装をして、テストをして、レビューしてもらってというイベントの方が抜け漏れなく伝えられるのではないだろうか。

ここを手掛かりに設計を進めていくことで、必要になるその他の情報も見つけやすくなる。

先ほどのエンジニアの例で言えば、チケットの管理ツールや、コードの実装に必要なエディタもリソースとして認識することができる。

ECサイトを例にしてみると、一番管理したいのは注文と発送、配送、支払いだ。

１−２リソースを洗い出す

次にリソースを洗い出す。ECサイトで言えば商品などのことだ。

リソースを見分けるには、名刺で言えるかを考えるとわかりやすい。

具体的には、先ほど特定したイベントに必要となる情報を特定していく。例えば、「注文」には「誰が」「何を」注文すると言う情報が必要だ。また「発送」と「配達」には「誰に」と「どこに」が必要だ。そして「支払い」には「誰が」「何で」が必要だ。（ここでは簡易的に支払いはクレカのみを想定している）

それらを特定したのが下の画像だ。

２エンティティに項目を入れていく

エンティティの抽出が終わったら各エンティティに必要な項目を入れていく。例えば、商品であれば「商品名」が項目として必要だ。

それらを行ったのが以下の図である。

３データの重複を排除する（正規化）

項目が各エンティティに入ったら、データの重複を排除するために正規化をする。正規化の目的を簡単に言うと、１つの事実を１つの場所にだけ保管しておくためだ。こうすることでデータの不整合が起きるのを防ぐ。

正規化のやり方については詳しくはこちらの記事を参照してほしい。
失敗しないデータベース正規化の3ステップをプロのエンジニアが解説

正規化をした結果、以下の画像のようになった。

この例では、以下の二つを正規化した。
・住所テーブルの都道府県や市区町村の値
・クレジットカードのカード会社

それらをテキストで管理するのではなく、マスターデータを用意してそちらを参照するようにした。

４エンティティ間の関連を定義する

エンティティ間の関連を定義する。

関連には以下の３つの種類がある。それぞれどう言う時に使うかを説明していく。

４−１一対一

まずは一対一だ。Aテーブルのレコードと、Bテーブルのレコードがあるとしよう。この時、AはBとだけ紐づいていて、BもAとだけ紐づいているパターンだ。

例えば、ECの例で言えば注文に対する発送や支払いなどで使われることがある。該当のレコードがなければ、まだ実行されていないなどといった判定ができる。

４−２一対多

次は一対多だ。著者とその著作物を考えるとわかりやすい。つまり、一人の著者に複数の著作物が紐づいている状態だ。

ER図で書き表すと以下のようになる。（三つ足に見える部分が多数からの紐付き、を所有することを表している）

ECサイトの例で言うと以下のようになる。

４−３多対多

最後は多対多だ。オンライン学習講座のサイトを考えるとわかりやすい。受講者は複数の講座を取れるし、講座は複数の受講者を持つことができる。

ER図で書き表すと以下のようになる。三つ足が受講者からも講座からも出ているのがわかる。

ECサイトの例で言うと、先ほどの商品と顧客が注文テーブルを介して多対多の関係になっていた。

５ビジネス要件を実現できるか確認する

ここまできたら、一旦今の構造でビジネス要件を満たせているかを確認する。現状のER図は以下の通りだ。

５−１各エンティティの紐付きを確認する

よく筆者がやる確認方法としては、各エンティティ間の紐付きをチェックする。例えば、「顧客」から出ている関連が正しいかを見る。
・顧客は複数の住所を持てる
・顧客は複数の配達を受けられる
・顧客は複数の発送を受けられる
・顧客は複数の注文ができる
・顧客は複数の支払いをできる
・顧客は複数のクレジットカードを持てる