SQLServer: ◆インデックスの概要と自習書を試す環境について

インデックス（Index）の概要

インデックスがない場合の検索時の内部動作

インデックスがないテーブルでは、データがどこに格納されているのかが分かりません。基本的には、データを追加（INSERT）した順に格納されていきますが、データを削除（DELETE）した場合には、その削除された領域は再利用されるので、追加や削除が繰り返される環境では、どこにどのデータが格納されているのかが分からなくなります。これについて、次の「社員」テーブルを例に考えてみましょう。

この社員テーブルには、インデックスを作成していません。このとき、次の SELECT ステートメントを実行して、姓が「Aoki」さんの社員を検索したとします。

SELECT * FROM 社員WHERE 姓 = 'Aoki'

SQL Server にとっては、「Aoki」さんのデータは、どこにあるのかが分からず、また、何件の「Aoki」さんがあるのかも分かりません。したがって、SQL Server が該当データを検索するには、次のように先頭から最後まで探し続けなければなりません。

このように、インデックスが存在しない場合には、どんなデータを検索する場合にも、必ず先頭から最後まで探し続けなければなりません。この動作は「Table Scan：テーブルスキャン」、「全表走査」、「全件検索」などと呼ばれています。テーブルスキャンは、データ量が 1,000件、2,000件など少ない場合には、（今のコンピューターの性能では）瞬間的に結果が返りますが、1,000万件、1億件など大量データになった場合には大変な実行時間がかかってしまいます。

Note：テーブルスキャンの速度はどれくらい？
テーブルスキャンの速度は、ディスクの読み取り速度（実測値）に大きく依存します。たとえば、テーブルサイズが 500MB で、ディスクの読み取り速度が 100MB / 秒だったとすると、テーブルスキャンには最低でも 5秒かかるわけです（メモリにキャッシュされていない場合）。また、テーブルサイズが 5GB だったとすると、最低でも 50秒はかかってしまうことになります。このように、テーブルスキャンの速度は、データ量が増えれば増えるほど、非常に時間がかかってしまうので、これを解決するための検索手法が「インデックス」です。

グラフィカル実行プラン

SQL Server には、内部的な実行方法（テーブルスキャンが実行されたか、インデックスが利用されたかなど）を簡単に知ることができる、グラフィカル実行プランという機能があります。

この機能のおかげで、テーブルスキャンが実行される、効率の悪い検索を簡単に調べることができるので、大変便利です。Step 2 以降では、これらの利用方法を具体的に説明します。

サンプルデータベース（sampleDB）の作成

この自習書では、すべての手順でサンプルスクリプトに含まれる「sampleDB」データベースを利用しているので、STEP2 以降を始める前に、このデータベースを SQL Server 2012 上へ作成しておいてください。作成の手順は、次のとおりです。

まずは、［スタート］メニューの［すべてのプログラム］から［Microsoft SQL Server 2012］の［SQL Server Management Studio］をクリックして、Management Studio を起動します。
接続完了後、次のようにツールバーの［ファイルを開く］ボタンをクリックします。

これにより、［ファイルを開く］ダイアログが表示されるので、サンプルスクリプトを解凍したフォルダーを展開して、「sampleDB.sql」ファイルを選択し、［開く］ボタンをクリックします。
次のようにデータベースを作成するためのスクリプトが表示されるので、ツールバーの［実行］ボタンをクリックして、スクリプトを実行します。
数秒後に実行が完了して、次のように画面下に「クエリが正常に実行されました」と表示されることを確認します。

以上でデータベースの作成が完了です。

SQLServer

2013年3月23日土曜日

◆インデックスの概要と自習書を試す環境について

インデックス（Index）の概要

インデックスがない場合の検索時の内部動作

グラフィカル実行プラン

サンプルデータベース（sampleDB）の作成

0 件のコメント:

コメントを投稿

2013年3月23日土曜日

◆インデックスの概要 と自習書を試す環境について

インデックス（Index）の概要

インデックスがない場合の検索時の内部動作

グラフィカル実行プラン

サンプル データベース（sampleDB）の作成

0 件のコメント:

コメントを投稿

◆インデックスの概要と自習書を試す環境について

サンプルデータベース（sampleDB）の作成