web-dev-qa-db-ja.com

リスト内の連続した整数を検出する

私はそのようなデータを含むリストを持っています:

[1, 2, 3, 4, 7, 8, 10, 11, 12, 13, 14]

連続する整数の範囲を出力したい:

1-4, 7-8, 10-14

これを行うための組み込み/高速/効率的な方法はありますか?

47
James

ドキュメント から:

>>> from itertools import groupby
>>> from operator import itemgetter
>>> data = [ 1, 4,5,6, 10, 15,16,17,18, 22, 25,26,27,28]
>>> for k, g in groupby(enumerate(data), lambda (i, x): i-x):
...     print map(itemgetter(1), g)
...
[1]
[4, 5, 6]
[10]
[15, 16, 17, 18]
[22]
[25, 26, 27, 28]

これをかなり簡単に適用して、印刷された範囲のセットを取得できます。

69
Dominic Rodger

これは、指定したとおりに印刷されます。

>>> nums = [1, 2, 3, 4, 7, 8, 10, 11, 12, 13, 14]
>>> ranges = sum((list(t) for t in Zip(nums, nums[1:]) if t[0]+1 != t[1]), [])
>>> iranges = iter(nums[0:1] + ranges + nums[-1:])
>>> print ', '.join([str(n) + '-' + str(next(iranges)) for n in iranges])
1-4, 7-8, 10-14

リストに単一の番号範囲がある場合、n-nとして表示されます。

>>> nums = [1, 2, 3, 4, 5, 7, 8, 9, 12, 15, 16, 17, 18]
>>> ranges = sum((list(t) for t in Zip(nums, nums[1:]) if t[0]+1 != t[1]), [])
>>> iranges = iter(nums[0:1] + ranges + nums[-1:])
>>> print ', '.join([str(n) + '-' + str(next(iranges)) for n in iranges])
1-5, 7-9, 12-12, 15-18
4
dansalmo

追加のインポートなしで機能する短いソリューション。反復可能なものを受け入れ、未ソートの入力をソートし、重複するアイテムを削除します。

def ranges(nums):
    nums = sorted(set(nums))
    gaps = [[s, e] for s, e in Zip(nums, nums[1:]) if s+1 < e]
    edges = iter(nums[:1] + sum(gaps, []) + nums[-1:])
    return list(Zip(edges, edges))

例:

>>> ranges([2, 3, 4, 7, 8, 9, 15])
[(2, 4), (7, 9), (15, 15)]

>>> ranges([-1, 0, 1, 2, 3, 12, 13, 15, 100])
[(-1, 3), (12, 13), (15, 15), (100, 100)]

>>> ranges(range(100))
[(0, 99)]

>>> ranges([0])
[(0, 0)]

>>> ranges([])
[]

これは、@ dansalmoの solution と同じですが、読みやすくて適用するのが少し難しいとはいえ(関数として提供されていないため)驚くべきものでした。

「従来の」オープン範囲を吐き出すように簡単に変更できることに注意してください[start, end)、例えばreturnステートメントの変更:

    return [(s, e+1) for s, e in Zip(edges, edges)]
3
coldfix

組み込み:いいえ、私が知っている限りでは。

アレイを実行する必要があります。最初の値を変数に入れて印刷し、次の数字を押し続ける限り、別の変数の最後の数字を覚えているだけです。次の番号が並んでいない場合は、最初に覚えた番号と最後の番号を確認してください。同じ場合は、何もしません。異なる場合は、「-」と最後の数字を印刷します。次に、現在の値を最初の変数に入れて、最初からやり直します。配列の最後で、行外の数字をヒットした場合と同じルーチンを実行します。

もちろん、コードを書くこともできますが、宿題を台無しにしたくありません:-)

3
TToni

モジュールを使用しない別の基本的なソリューションは、インタビューに適しています。通常は、モジュールを使用せずに尋ねたインタビューで使用します。

#!/usr/bin/python

def split_list(n):
    """will return the list index"""
    return [(x+1) for x,y in Zip(n, n[1:]) if y-x != 1]

def get_sub_list(my_list):
    """will split the list base on the index"""
    my_index = split_list(my_list)
    output = list()
    prev = 0
    for index in my_index:
        new_list = [ x for x in my_list[prev:] if x < index]
        output.append(new_list)
        prev += len(new_list)
    output.append([ x for x in my_list[prev:]])
    return output

my_list = [1, 3, 4, 7, 8, 10, 11, 13, 14]
print get_sub_list(my_list)

出力:

[[1], [3, 4], [7, 8], [10, 11], [13, 14]]
0
James Sapam

私は同様の問題があり、ソートされたリストに次のものを使用しています。辞書にリストされた値の範囲を持つ辞書を出力します。キーは、連続する番号の各実行を分離し、連続する番号間の非連続項目の実行中の合計でもあります。

リストから{0: [1, 4], 1: [7, 8], 2: [10, 14]}の出力が得られます

def series_dictf(index_list):
    from collections import defaultdict    
    series_dict = defaultdict(list)
    sequence_dict = dict()

    list_len = len(index_list)
    series_interrupts = 0    

    for i in range(list_len):
        if i == (list_len - 1):
                break

        position_a = index_list[i]
        position_b = index_list[i + 1]

        if position_b == (position_a + 1):
            sequence_dict[position_a] = (series_interrupts)
            sequence_dict[position_b] = (series_interrupts)

        if position_b != (position_a + 1):
            series_interrupts += 1  

    for position, series in sequence_dict.items():
        series_dict[series].append(position)
    for series, position in series_dict.items():
        series_dict[series] = [position[0], position[-1]]

    return series_dict
0

集合演算を使用して、次のアルゴリズムを実行できます

def get_consecutive_integer_series(integer_list):
    integer_list = sorted(integer_list)
    start_item = integer_list[0]
    end_item = integer_list[-1]

    a = set(integer_list)  # Set a
    b = range(start_item, end_item+1)

    # Pick items that are not in range.
    c = set(b) - a  # Set operation b-a

    li = []
    start = 0
    for i in sorted(c):
        end = b.index(i)  # Get end point of the list slicing
        li.append(b[start:end])  # Slice list using values
        start = end + 1  # Increment the start point for next slicing
    li.append(b[start:])  # Add the last series

    for sliced_list in li:
        if not sliced_list:
            # list is empty
            continue
        if len(sliced_list) == 1:
            # If only one item found in list
            yield sliced_list[0]
        else:
            yield "{0}-{1}".format(sliced_list[0], sliced_list[-1])


a = [1, 2, 3, 6, 7, 8, 4, 14, 15, 21]
for series in get_consecutive_integer_series(a):
    print series

上記のリスト「a」の出力
1-4
6-8
14-15
21

0
theBuzzyCoder