MyISAMとInnoDBのベスト

Question

RAM）の制限により、同時実行パフォーマンスの利点を得ながら、InnoDBでクラスター化インデックスの代わりにMyISAMと同じインデックスを使用することは可能ですか？

RolandoMySQLDBA · Accepted Answer

InnoDBの内部にある gen_clust_index （クラスタ化インデックス）には、ROWIDとともに主キーのエントリが格納されています。 gen_clust_indexの使用に関して興味深いのは、作成する一意でないインデックスには常に、テーブルのgen_clust_indexに対応するROWIDがあるということです。したがって、セカンダリインデックス用とgen_clust_index用の二重のインデックスルックアップが常に存在します。

テーブルまたは主キーのレイアウトを改善しようとすると、gen_clust_indexが原因で無効になるか、せいぜい限界的な結果になります。

例

MyISAMを主キーの順序で並べ替えようとする人もいます。 MySQLデータベースの設計とチューニング、ページ236パラグラフ7、「インデックス順でのテーブルの保存」の副題：によると==

テーブルから広範囲のインデックス付きデータを頻繁に取得する場合、または同じインデックスキーで結果を一貫してソートする場合は、-sort-recordsオプションを指定してmyisamchkを実行することを検討してください。そうすることで、MySQLにテーブルのデータをインデックスと同じ物理的な順序でソートするように指示し、これらの種類の操作を高速化することができます。または、ALTER TABLEステートメントを特定の列オプションのORDER BYと組み合わせて、同じ結果を得ることができます。

確かに、これは機能し、効果的に機能しますFOR MyISAM。列がプライマリキーの列である場合とそうでない場合があるInnoDBに対して、ALTER TABLE ... ORDER BY col1、col2、...、colnを実行できます。 ...その通りです...毎回gen_clust_indexを参照する必要があるため、これはInnoDBの結果を高速化しません。

一部の人々は、ALTER TABLE mydb.mytb ROW_FORMAT=Fixed;を使用してテーブルの行フォーマットをFIXEDにすることができ、他の変更なしで読み取りパフォーマンスを20％向上させることができます。これは機能し、効果的に機能しますFOR MyISAM。 ...その通りです...毎回gen_clust_indexを参照する必要があるため、これはInnoDBの結果を高速化しません。

Mydb.mytbという名前のInnoDBテーブルで次を実行できます。

CREATE TABLE mydb.mytc LIKE mydb.mytb; INSERT INTO mydb.mytc SELECT * FROM mydb.mytb ORDER BY col1,col2,...coln; ALTER TABLE mydb.mytb RENAME mydb.mytd; ALTER TABLE mydb.mytc RENAME mydb.mytb; DROP TABLE mydb.mytd;

これにより、gen_clust_indexにテーブルがROWID順に配置されます。 ...その通りです...毎回gen_clust_indexを参照する必要があるため、これはInnoDBに最低限の結果をもたらす可能性があります。

さて、ちょっとばかげてみましょう。 MyISAMとInnoDBをクエリするNoSQLインターフェースがあります HandlerSocket（以前の名前はHANLDER）インターフェースと呼ばれます。これにより、すべてのSQLをバイパスできるデータにアクセスできます [〜＃〜] acid [〜＃〜] 、および [〜＃〜] mvcc [〜＃〜] =プロトコル。可能ではありますが、私見ではコードの作成と保守が複雑すぎます。申し訳ありませんが、HandlerSocketインターフェースがgen_clust_indexと対話するかどうかを示すものは何もありません。

要約すると、猫の皮をむく方法はたくさんあります。この場合、猫（gen_clust_index）を手に入れることはできません。 MyISAMがその読み取りパフォーマンス、テーブルの順序付け、テーブルの行形式の柔軟性、およびそれをサポートするツールのために存在し続けるのは、これが理由だと思います。 InnoDBは、ACID準拠の性質を中心に設計されたままであり、勇気ある人がInnoDBソースコードを取得して、MyISAMとInnoDBの両方の中で最高のものに変換します。

Morgan Tocker · Answer

短い答え：いいえ。

InnoDBは主キーを介してクラスター化し、主キーがない場合、最初の一意のインデックスを選択します。一意のインデックスがない場合、クラスタリング用の非表示の6バイトのキーが作成されます。

非表示の6バイトのキーがある場合、セカンダリインデックスは（MyISAMのように）行の場所への正確なポインターではなく、このキーを参照するため、最終的にセカンダリキートラバーサル、次にプライマリキートラバーサルでレコードを検索します。。

あなたのリーフページを見つけるために常にこのパスを歩く必要があるので、効率的に検索するにはすべてのルートノードがメモリ内にあるはずなので、あなたはあなたの質問から少し外挿するために、ツリーとのメモリフィットについて心配していると思いますか？

これは本当ですが、1つの慰めは商業データベースがそれらの木を深くではなく、可能な限り太くしようとすることです。確認するには、データに対して xtrabackup --stats を実行してみてください。例えば：

<INDEX STATISTICS> table: test/table1, index: PRIMARY, space id: 12, root page 3 estimated statistics in dictionary: key vals: 25265338, leaf pages 497839, size pages 498304 real statistics: level 2 pages: pages=1, data=5395 bytes, data/pages=32% level 1 pages: pages=415, data=6471907 bytes, data/pages=95% leaf pages: recs=25958413, pages=497839, data=7492026403 bytes, data/pages=91%

497839枚のリーフページ（約8 GB）がありましたが、上に416ページ（6.5 MB）しかありませんでした。このコマンドを本番データで数回実行しましたが、数百億から数十億のレコードがあり、レベル1〜3ページ+リーフページしかない場合は、常に驚きます。

Derek Downey · Answer

クラスター化インデックスは、おそらく従来のスピンドライブでのInnoDBの同時実行パフォーマンスの理由です。

クラスター化されたインデックスを介した行へのアクセスは、行データがインデックス検索と同じページにあるため、高速です。テーブルが大きい場合、クラスター化インデックスアーキテクチャは、インデックスレコードとは異なるページを使用して行データを格納するストレージ組織と比較して、ディスクI/O操作を節約することがよくあります。（たとえば、MyISAMはデータ行に1つのファイルを使用し、インデックスレコードに別のファイルを使用します。）

ディスクI/Oは高価です。したがって、これを減らすことは、同時実行性を向上させるための大きなメリットです。

ディスクI/Oが安くなり、ボトルネックが少なくなった場合（SSDテクノロジーがより安定するなど）、OracleはInnoDBインデックスの動作を変更する場合があります。同じテクノロジーで「RAMの制限」の問題が少なくなるため、同じままになる可能性が高くなります。