MySQLのランク関数

Question

顧客のランクを調べる必要があります。ここで、要件に対応するANSI標準SQLクエリを追加しています。 MySQLに変換するのを手伝ってください。

SELECT RANK() OVER (PARTITION BY Gender ORDER BY Age) AS [Partition by Gender], FirstName, Age, Gender FROM Person

MySQLでランクを調べる関数はありますか？

Daniel Vassallo · Accepted Answer

1つのオプションは、次のようなランキング変数を使用することです。

SELECT first_name, age, gender, @curRank := @curRank + 1 AS rank FROM person p, (SELECT @curRank := 0) r ORDER BY age;

(SELECT @curRank := 0)部分では、個別のSETコマンドを必要とせずに変数を初期化できます。

テストケース：

CREATE TABLE person (id int, first_name varchar(20), age int, gender char(1)); INSERT INTO person VALUES (1, 'Bob', 25, 'M'); INSERT INTO person VALUES (2, 'Jane', 20, 'F'); INSERT INTO person VALUES (3, 'Jack', 30, 'M'); INSERT INTO person VALUES (4, 'Bill', 32, 'M'); INSERT INTO person VALUES (5, 'Nick', 22, 'M'); INSERT INTO person VALUES (6, 'Kathy', 18, 'F'); INSERT INTO person VALUES (7, 'Steve', 36, 'M'); INSERT INTO person VALUES (8, 'Anne', 25, 'F');

結果：

+------------+------+--------+------+ | first_name | age | gender | rank | +------------+------+--------+------+ | Kathy | 18 | F | 1 | | Jane | 20 | F | 2 | | Nick | 22 | M | 3 | | Bob | 25 | M | 4 | | Anne | 25 | F | 5 | | Jack | 30 | M | 6 | | Bill | 32 | M | 7 | | Steve | 36 | M | 8 | +------------+------+--------+------+ 8 rows in set (0.02 sec)

Salman A · Answer

パーティション上の密なランクを行に割り当てる一般的なソリューションを次に示します。ユーザー変数を使用します。

CREATE TABLE person ( id INT NOT NULL PRIMARY KEY, firstname VARCHAR(10), gender VARCHAR(1), age INT ); INSERT INTO person (id, firstname, gender, age) VALUES (1, 'Adams', 'M', 33), (2, 'Matt', 'M', 31), (3, 'Grace', 'F', 25), (4, 'Harry', 'M', 20), (5, 'Scott', 'M', 30), (6, 'Sarah', 'F', 30), (7, 'Tony', 'M', 30), (8, 'Lucy', 'F', 27), (9, 'Zoe', 'F', 30), (10, 'Megan', 'F', 26), (11, 'Emily', 'F', 20), (12, 'Peter', 'M', 20), (13, 'John', 'M', 21), (14, 'Kate', 'F', 35), (15, 'James', 'M', 32), (16, 'Cole', 'M', 25), (17, 'Dennis', 'M', 27), (18, 'Smith', 'M', 35), (19, 'Zack', 'M', 35), (20, 'Jill', 'F', 25); SELECT person.*, @rank := CASE WHEN @partval = gender AND @rankval = age THEN @rank WHEN @partval = gender AND (@rankval := age) IS NOT NULL THEN @rank + 1 WHEN (@partval := gender) IS NOT NULL AND (@rankval := age) IS NOT NULL THEN 1 END AS rnk FROM person, (SELECT @rank := NULL, @partval := NULL, @rankval := NULL) AS x ORDER BY gender, age;

変数の割り当てがCASE式の中に配置されていることに注意してください。これは（理論上）評価の問題の順序を処理します。 IS NOT NULLは、データ型の変換と短絡の問題を処理するために追加されます。

PS：タイをチェックするすべての条件を削除することにより、パーティション上の行番号に簡単に変換できます。

| id | firstname | gender | age | rank | |----|-----------|--------|-----|------| | 11 | Emily | F | 20 | 1 | | 20 | Jill | F | 25 | 2 | | 3 | Grace | F | 25 | 2 | | 10 | Megan | F | 26 | 3 | | 8 | Lucy | F | 27 | 4 | | 6 | Sarah | F | 30 | 5 | | 9 | Zoe | F | 30 | 5 | | 14 | Kate | F | 35 | 6 | | 4 | Harry | M | 20 | 1 | | 12 | Peter | M | 20 | 1 | | 13 | John | M | 21 | 2 | | 16 | Cole | M | 25 | 3 | | 17 | Dennis | M | 27 | 4 | | 7 | Tony | M | 30 | 5 | | 5 | Scott | M | 30 | 5 | | 2 | Matt | M | 31 | 6 | | 15 | James | M | 32 | 7 | | 1 | Adams | M | 33 | 8 | | 18 | Smith | M | 35 | 9 | | 19 | Zack | M | 35 | 9 |

db <> fiddleのデモ

Rahul Agarwal · Answer

最も投票された回答はランク付けされますが、分割されませんが、自己結合を実行して全体を分割することもできます：

SELECT a.first_name, a.age, a.gender, count(b.age)+1 as rank FROM person a left join person b on a.age>b.age and a.gender=b.gender group by a.first_name, a.age, a.gender

ユースケース

CREATE TABLE person (id int, first_name varchar(20), age int, gender char(1)); INSERT INTO person VALUES (1, 'Bob', 25, 'M'); INSERT INTO person VALUES (2, 'Jane', 20, 'F'); INSERT INTO person VALUES (3, 'Jack', 30, 'M'); INSERT INTO person VALUES (4, 'Bill', 32, 'M'); INSERT INTO person VALUES (5, 'Nick', 22, 'M'); INSERT INTO person VALUES (6, 'Kathy', 18, 'F'); INSERT INTO person VALUES (7, 'Steve', 36, 'M'); INSERT INTO person VALUES (8, 'Anne', 25, 'F');

回答：

Bill 32 M 4 Bob 25 M 2 Jack 30 M 3 Nick 22 M 1 Steve 36 M 5 Anne 25 F 3 Jane 20 F 2 Kathy 18 F 1

Mukesh Soni · Answer

ランクとともにパーセンタイルを計算するためのダニエル版の微調整。また、同じマークを持つ2人は同じランクになります。

set @totalStudents = 0; select count(*) into @totalStudents from marksheets; SELECT id, score, @curRank := IF(@prevVal=score, @curRank, @studentNumber) AS rank, @percentile := IF(@prevVal=score, @percentile, (@totalStudents - @studentNumber + 1)/(@totalStudents)*100), @studentNumber := @studentNumber + 1 as studentNumber, @prevVal:=score FROM marksheets, ( SELECT @curRank :=0, @prevVal:=null, @studentNumber:=1, @percentile:=100 ) r ORDER BY score DESC

サンプルデータのクエリの結果-

+----+-------+------+---------------+---------------+-----------------+ | id | score | rank | percentile | studentNumber | @prevVal:=score | +----+-------+------+---------------+---------------+-----------------+ | 10 | 98 | 1 | 100.000000000 | 2 | 98 | | 5 | 95 | 2 | 90.000000000 | 3 | 95 | | 6 | 91 | 3 | 80.000000000 | 4 | 91 | | 2 | 91 | 3 | 80.000000000 | 5 | 91 | | 8 | 90 | 5 | 60.000000000 | 6 | 90 | | 1 | 90 | 5 | 60.000000000 | 7 | 90 | | 9 | 84 | 7 | 40.000000000 | 8 | 84 | | 3 | 83 | 8 | 30.000000000 | 9 | 83 | | 4 | 72 | 9 | 20.000000000 | 10 | 72 | | 7 | 60 | 10 | 10.000000000 | 11 | 60 | +----+-------+------+---------------+---------------+-----------------+

erandac · Answer

ダニエルとサルマンの答えの組み合わせ。ただし、同順位の連続シーケンスが存在するため、ランクは付与されません。代わりに、ランクを次にスキップします。したがって、最大数は常に行数に達します。

 SELECT first_name, age, gender, IF(age=@_last_age,@curRank:=@curRank,@curRank:=@_sequence) AS rank, @_sequence:=@_sequence+1,@_last_age:=age FROM person p, (SELECT @curRank := 1, @_sequence:=1, @_last_age:=0) r ORDER BY age;

スキーマとテストケース：

CREATE TABLE person (id int, first_name varchar(20), age int, gender char(1)); INSERT INTO person VALUES (1, 'Bob', 25, 'M'); INSERT INTO person VALUES (2, 'Jane', 20, 'F'); INSERT INTO person VALUES (3, 'Jack', 30, 'M'); INSERT INTO person VALUES (4, 'Bill', 32, 'M'); INSERT INTO person VALUES (5, 'Nick', 22, 'M'); INSERT INTO person VALUES (6, 'Kathy', 18, 'F'); INSERT INTO person VALUES (7, 'Steve', 36, 'M'); INSERT INTO person VALUES (8, 'Anne', 25, 'F'); INSERT INTO person VALUES (9, 'Kamal', 25, 'M'); INSERT INTO person VALUES (10, 'Saman', 32, 'M');

出力：

+------------+------+--------+------+--------------------------+-----------------+ | first_name | age | gender | rank | @_sequence:=@_sequence+1 | @_last_age:=age | +------------+------+--------+------+--------------------------+-----------------+ | Kathy | 18 | F | 1 | 2 | 18 | | Jane | 20 | F | 2 | 3 | 20 | | Nick | 22 | M | 3 | 4 | 22 | | Kamal | 25 | M | 4 | 5 | 25 | | Anne | 25 | F | 4 | 6 | 25 | | Bob | 25 | M | 4 | 7 | 25 | | Jack | 30 | M | 7 | 8 | 30 | | Bill | 32 | M | 8 | 9 | 32 | | Saman | 32 | M | 8 | 10 | 32 | | Steve | 36 | M | 10 | 11 | 36 | +------------+------+--------+------+--------------------------+-----------------+

Lukas Eder · Answer

MySQL 8以降では、MySQLでもウィンドウ関数を最終的に使用できます。 https://dev.mysql.com/doc/refman/8.0/en/window-functions.html

クエリはまったく同じ方法で記述できます。

SELECT RANK() OVER (PARTITION BY Gender ORDER BY Age) AS `Partition by Gender`, FirstName, Age, Gender FROM Person

David Husnian · Answer

@Sam、あなたのポイントは優れた概念ですが、MySQLドキュメントが参照ページで言っていることを誤解していると思います-または私は誤解しています:-)-そして、私はこれを追加したかったので、誰かが@ダニエルの答えは、彼らをより安心させるか、少なくとも少し掘り下げます。

SELECT内の「@curRank：= @curRank + 1 AS rank」は「1つのステートメント」ではなく、ステートメントの「アトミック」な部分であるため、安全であることがわかります。

参照するドキュメントでは、たとえば、「SELECT @curRank、@curRank：= @curRank + 1 AS rank」など、ステートメントの2つの（アトミック）部分に同じユーザー定義変数がある例を示します。

@Danielの答えで@curRankが2回使用されていると主張するかもしれません：（1）「@curRank：= @curRank + 1 AS rank」および（2）「（SELECT @curRank：= 0）r」使用法はFROM句の一部です。最初に評価されることが保証されていると確信しています。基本的に、2番目の、前のステートメントにします。

実際、参照した同じMySQLドキュメントページで、コメントに同じソリューションが表示されます。@ Danielが取得した場所である可能性があります。ええ、私はそれがコメントであることを知っていますが、それは公式のドキュメントページのコメントであり、それはある程度の重みを持ちます。

Salman A · Answer

与えられた値のランクを決定する最も簡単な解決策は、値の数を数えることですbefore。次の値があるとします。

10 20 30 30 30 40

すべての30値は考慮されますrd
すべての40値は、6th（ランク）または4th（高密度ランク）と見なされます

元の質問に戻りましょう。 OPの説明に従ってソートされたサンプルデータを次に示します（予想されるランクは右側に追加されます）。

+------+-----------+------+--------+ +------+------------+ | id | firstname | age | gender | | rank | dense_rank | +------+-----------+------+--------+ +------+------------+ | 11 | Emily | 20 | F | | 1 | 1 | | 3 | Grace | 25 | F | | 2 | 2 | | 20 | Jill | 25 | F | | 2 | 2 | | 10 | Megan | 26 | F | | 4 | 3 | | 8 | Lucy | 27 | F | | 5 | 4 | | 6 | Sarah | 30 | F | | 6 | 5 | | 9 | Zoe | 30 | F | | 6 | 5 | | 14 | Kate | 35 | F | | 8 | 6 | | 4 | Harry | 20 | M | | 1 | 1 | | 12 | Peter | 20 | M | | 1 | 1 | | 13 | John | 21 | M | | 3 | 2 | | 16 | Cole | 25 | M | | 4 | 3 | | 17 | Dennis | 27 | M | | 5 | 4 | | 5 | Scott | 30 | M | | 6 | 5 | | 7 | Tony | 30 | M | | 6 | 5 | | 2 | Matt | 31 | M | | 8 | 6 | | 15 | James | 32 | M | | 9 | 7 | | 1 | Adams | 33 | M | | 10 | 8 | | 18 | Smith | 35 | M | | 11 | 9 | | 19 | Zack | 35 | M | | 11 | 9 | +------+-----------+------+--------+ +------+------------+

SarahのRANK() OVER (PARTITION BY Gender ORDER BY Age)を計算するには、次のクエリを使用できます。

SELECT COUNT(id) + 1 AS rank, COUNT(DISTINCT age) + 1 AS dense_rank FROM testdata WHERE gender = (SELECT gender FROM testdata WHERE id = 6) AND age < (SELECT age FROM testdata WHERE id = 6) +------+------------+ | rank | dense_rank | +------+------------+ | 6 | 5 | +------+------------+

All行のRANK() OVER (PARTITION BY Gender ORDER BY Age)を計算するには、このクエリを使用できます：

SELECT testdata.id, COUNT(lesser.id) + 1 AS rank, COUNT(DISTINCT lesser.age) + 1 AS dense_rank FROM testdata LEFT JOIN testdata AS lesser ON lesser.age < testdata.age AND lesser.gender = testdata.gender GROUP BY testdata.id

結果は次のとおりです（結合された値は右側に追加されます）。

+------+------+------------+ +-----------+-----+--------+ | id | rank | dense_rank | | firstname | age | gender | +------+------+------------+ +-----------+-----+--------+ | 11 | 1 | 1 | | Emily | 20 | F | | 3 | 2 | 2 | | Grace | 25 | F | | 20 | 2 | 2 | | Jill | 25 | F | | 10 | 4 | 3 | | Megan | 26 | F | | 8 | 5 | 4 | | Lucy | 27 | F | | 6 | 6 | 5 | | Sarah | 30 | F | | 9 | 6 | 5 | | Zoe | 30 | F | | 14 | 8 | 6 | | Kate | 35 | F | | 4 | 1 | 1 | | Harry | 20 | M | | 12 | 1 | 1 | | Peter | 20 | M | | 13 | 3 | 2 | | John | 21 | M | | 16 | 4 | 3 | | Cole | 25 | M | | 17 | 5 | 4 | | Dennis | 27 | M | | 5 | 6 | 5 | | Scott | 30 | M | | 7 | 6 | 5 | | Tony | 30 | M | | 2 | 8 | 6 | | Matt | 31 | M | | 15 | 9 | 7 | | James | 32 | M | | 1 | 10 | 8 | | Adams | 33 | M | | 18 | 11 | 9 | | Smith | 35 | M | | 19 | 11 | 9 | | Zack | 35 | M | +------+------+------------+ +-----------+-----+--------+

Sam Kidman · Answer

1人だけをランク付けする場合は、次を実行できます。

SELECT COUNT(Age) + 1 FROM PERSON WHERE(Age < age_to_rank)

このランキングは、Oracle RANK関数に対応します（同じ年齢の人がいる場合、同じランクを取得し、その後のランキングは連続しません）。

サブクエリで上記のソリューションのいずれかを使用し、そこから選択して1人のランキングを取得するよりも少し高速です。

これはすべての人をランク付けするために使用できますが、上記のソリューションよりも低速です。

SELECT Age AS age_var, ( SELECT COUNT(Age) + 1 FROM Person WHERE (Age < age_var) ) AS rank FROM Person

Max · Answer

ダニエルの答えとサルマンの答えを組み合わせたエランダックの答えの「 however 」を回避するには、次の「パーティションの回避策」のいずれかを使用できます。

SELECT customerID, myDate -- partition ranking works only with CTE / from MySQL 8.0 on , RANK() OVER (PARTITION BY customerID ORDER BY dateFrom) AS rank, -- Erandac's method in combination of Daniel's and Salman's -- count all items in sequence, maximum reaches row count. , IF(customerID=@_lastRank, @_curRank:=@_curRank, @_curRank:=@_sequence+1) AS sequenceRank , @_sequence:=@_sequence+1 as sequenceOverAll -- Dense partition ranking, works also with MySQL 5.7 -- remember to set offset values in from clause , IF(customerID=@_lastRank, @_nxtRank:=@_nxtRank, @_nxtRank:=@_nxtRank+1 ) AS partitionRank , IF(customerID=@_lastRank, @_overPart:=@_overPart+1, @_overPart:=1 ) AS partitionSequence , @_lastRank:=customerID FROM myCustomers, (SELECT @_curRank:=0, @_sequence:=0, @_lastRank:=0, @_nxtRank:=0, @_overPart:=0 ) r ORDER BY customerID, myDate

このコードスニペットの3番目のバリアントのパーティションランキングは、連続したランキング番号を返します。これにより、rank() over partition byの結果と同様のデータ構造が得られます。例として、以下を参照してください。特に、partitionSequenceは、このメソッドを使用して、新しいpartitionRankごとに常に1から始まります。

customerID myDate sequenceRank (Erandac) | sequenceOverAll | | partitionRank | | | partitionSequence | | | | lastRank ... lines ommitted for clarity 40 09.11.2016 11:19 1 44 1 44 40 40 09.12.2016 12:08 1 45 1 45 40 40 09.12.2016 12:08 1 46 1 46 40 40 09.12.2016 12:11 1 47 1 47 40 40 09.12.2016 12:12 1 48 1 48 40 40 13.10.2017 16:31 1 49 1 49 40 40 15.10.2017 11:00 1 50 1 50 40 76 01.07.2015 00:24 51 51 2 1 76 77 04.08.2014 13:35 52 52 3 1 77 79 15.04.2015 20:25 53 53 4 1 79 79 24.04.2018 11:44 53 54 4 2 79 79 08.10.2018 17:37 53 55 4 3 79 117 09.07.2014 18:21 56 56 5 1 117 119 26.06.2014 13:55 57 57 6 1 119 119 02.03.2015 10:23 57 58 6 2 119 119 12.10.2015 10:16 57 59 6 3 119 119 08.04.2016 09:32 57 60 6 4 119 119 05.10.2016 12:41 57 61 6 5 119 119 05.10.2016 12:42 57 62 6 6 119 ...