リストをほぼ等しい長さのN個の部分に分割する

Question

リストを大まかに等しい部分に分割する最良の方法は何ですか？たとえば、リストに7つの要素があり、2つの部分に分割されている場合、1つの部分に3つの要素を取得し、もう1つの部分には4つの要素が必要です。

Lをnの部分に分割するeven_split(L, n)のようなものを探しています。

def chunks(L, n): """ Yield successive n-sized chunks from L. """ for i in xrange(0, len(L), n): yield L[i:i+n]

上記のコードは、3つのチャンクではなく、3つのチャンクを提供します。私は単純に転置することができます（これを繰り返して各列の最初の要素を取得し、そのパート1を呼び出し、次に2番目を取得してパート2に配置するなど）が、それはアイテムの順序を破壊します。

Max Shawabkeh · Accepted Answer

動作するものは次のとおりです。

def chunkIt(seq, num): avg = len(seq) / float(num) out = [] last = 0.0 while last < len(seq): out.append(seq[int(last):int(last + avg)]) last += avg return out

テスト：

>>> chunkIt(range(10), 3) [[0, 1, 2], [3, 4, 5], [6, 7, 8, 9]] >>> chunkIt(range(11), 3) [[0, 1, 2], [3, 4, 5, 6], [7, 8, 9, 10]] >>> chunkIt(range(12), 3) [[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11]]

tixxit · Answer

リストジェネレータとしてかなり簡単に書くことができます：

def split(a, n): k, m = divmod(len(a), n) return (a[i * k + min(i, m):(i + 1) * k + min(i + 1, m)] for i in xrange(n))

例：

>>> list(split(range(11), 3)) [[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10]]

job · Answer

連続したチャンクのような愚かなものが必要ない限り：

>>> def chunkify(lst,n): ... return [lst[i::n] for i in xrange(n)] ... >>> chunkify(range(13), 3) [[0, 3, 6, 9, 12], [1, 4, 7, 10], [2, 5, 8, 11]]

wim · Answer

これは、 numpy.array_split *のraison d'êtreです。

>>> L [0, 1, 2, 3, 4, 5, 6, 7] >>> print(*np.array_split(L, 3)) [0 1 2] [3 4 5] [6 7] >>> print(*np.array_split(range(10), 4)) [0 1 2] [3 4 5] [6 7] [8 9]

_{*クレジット： Zero Piraeus ルーム6}

paxdiablo · Answer

nのチャンクではなく、nチャンクを生成するコードの変更：

def chunks(l, n): """ Yield n successive chunks from l. """ newn = int(len(l) / n) for i in xrange(0, n-1): yield l[i*newn:i*newn+newn] yield l[n*newn-newn:] l = range(56) three_chunks = chunks (l, 3) print three_chunks.next() print three_chunks.next() print three_chunks.next()

与えるもの：

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17] [18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35] [36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55]

これにより、完全ではないが「おおよそN個の等しい部分」の仕様内である最終グループに追加の要素が割り当てられます:-)それにより、56個の要素が（19,19,18）として優れていることを意味します（18、18、20）。

次のコードを使用すると、よりバランスの取れた出力を取得できます。

#!/usr/bin/python def chunks(l, n): """ Yield n successive chunks from l. """ newn = int(1.0 * len(l) / n + 0.5) for i in xrange(0, n-1): yield l[i*newn:i*newn+newn] yield l[n*newn-newn:] l = range(56) three_chunks = chunks (l, 3) print three_chunks.next() print three_chunks.next() print three_chunks.next()

どの出力：

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18] [19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37] [38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55]

MaPePeR · Answer

n要素をおよそkチャンクに分割する場合、n % kチャンクを他のチャンクより1要素大きくして、余分な要素を分散できます。

次のコードは、チャンクの長さを示します。

[(n // k) + (1 if i < (n % k) else 0) for i in range(k)]

例：n=11, k=3は[4, 4, 3]になります

その後、チャンクの開始インディゼーションを簡単に計算できます。

[i * (n // k) + min(i, n % k) for i in range(k)]

例：n=11, k=3は[0, 4, 8]になります

i+1thチャンクを境界として使用すると、リストのithチャンクlとlen nは

l[i * (n // k) + min(i, n % k):(i+1) * (n // k) + min(i+1, n % k)]

最後のステップとして、リスト内包表記を使用してすべてのチャンクからリストを作成します。

[l[i * (n // k) + min(i, n % k):(i+1) * (n // k) + min(i+1, n % k)] for i in range(k)]

例：n=11, k=3, l=range(n)は[range(0, 4), range(4, 8), range(8, 11)]になります

pylang · Answer

more_itertools.divide を参照してください：

n = 2 [list(x) for x in mit.divide(n, range(5, 11))] # [[5, 6, 7], [8, 9, 10]] [list(x) for x in mit.divide(n, range(5, 12))] # [[5, 6, 7, 8], [9, 10, 11]]

> pip install more_itertools でインストールします。

John La Rooy · Answer

リストの長さを等しくするためにNoneを追加するものです

>>> from itertools import izip_longest >>> def chunks(l, n): """ Yield n successive chunks from l. Pads extra spaces with None """ return list(Zip(*izip_longest(*[iter(l)]*n))) >>> l=range(54) >>> chunks(l,3) [(0, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51), (1, 4, 7, 10, 13, 16, 19, 22, 25, 28, 31, 34, 37, 40, 43, 46, 49, 52), (2, 5, 8, 11, 14, 17, 20, 23, 26, 29, 32, 35, 38, 41, 44, 47, 50, 53)] >>> chunks(l,4) [(0, 4, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52), (1, 5, 9, 13, 17, 21, 25, 29, 33, 37, 41, 45, 49, 53), (2, 6, 10, 14, 18, 22, 26, 30, 34, 38, 42, 46, 50, None), (3, 7, 11, 15, 19, 23, 27, 31, 35, 39, 43, 47, 51, None)] >>> chunks(l,5) [(0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50), (1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51), (2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52), (3, 8, 13, 18, 23, 28, 33, 38, 43, 48, 53), (4, 9, 14, 19, 24, 29, 34, 39, 44, 49, None)]

bitagoras · Answer

これにより、単一の式で分割が行われます。

>>> myList = range(18) >>> parts = 5 >>> [myList[(i*len(myList))//parts:((i+1)*len(myList))//parts] for i in range(parts)] [[0, 1, 2], [3, 4, 5, 6], [7, 8, 9], [10, 11, 12, 13], [14, 15, 16, 17]]

この例のリストのサイズは18で、5つの部分に分かれています。パーツのサイズは、1つの要素のみで異なります。

leotrubach · Answer

私の解決策は次のとおりです。

def chunks(l, amount): if amount < 1: raise ValueError('amount must be positive integer') chunk_len = len(l) // amount leap_parts = len(l) % amount remainder = amount // 2 # make it symmetrical i = 0 while i < len(l): remainder += leap_parts end_index = i + chunk_len if remainder >= amount: remainder -= amount end_index += 1 yield l[i:end_index] i = end_index

生産する

 >>> list(chunks([1, 2, 3, 4, 5, 6, 7], 3)) [[1, 2], [3, 4, 5], [6, 7]]

amit12690 · Answer

Numpy.linspaceメソッドを使用した実装。

配列を分割する部分の数を指定するだけです。分割はほぼ同じサイズになります。

例：

import numpy as np a=np.arange(10) print "Input array:",a parts=3 i=np.linspace(np.min(a),np.max(a)+1,parts+1) i=np.array(i,dtype='uint16') # Indices should be floats split_arr=[] for ind in range(i.size-1): split_arr.append(a[i[ind]:i[ind+1]] print "Array split in to %d parts : "%(parts),split_arr

与える：

Input array: [0 1 2 3 4 5 6 7 8 9] Array split in to 3 parts : [array([0, 1, 2]), array([3, 4, 5]), array([6, 7, 8, 9])]

PM 2Ring · Answer

これは、正の（整数）数のチャンクを処理できるジェネレーターです。チャンクの数が入力リストの長さより大きい場合、一部のチャンクは空になります。このアルゴリズムは、短いチャンクと長いチャンクを分離するのではなく、交互に切り替えます。

ragged_chunks関数をテストするためのコードも含めました。

''' Split a list into "ragged" chunks The size of each chunk is either the floor or ceiling of len(seq) / chunks chunks can be > len(seq), in which case there will be empty chunks Written by PM 2Ring 2017.03.30 ''' def ragged_chunks(seq, chunks): size = len(seq) start = 0 for i in range(1, chunks + 1): stop = i * size // chunks yield seq[start:stop] start = stop # test def test_ragged_chunks(maxsize): for size in range(0, maxsize): seq = list(range(size)) for chunks in range(1, size + 1): minwidth = size // chunks #ceiling division maxwidth = -(-size // chunks) a = list(ragged_chunks(seq, chunks)) sizes = [len(u) for u in a] deltas = all(minwidth <= u <= maxwidth for u in sizes) assert all((sum(a, []) == seq, sum(sizes) == size, deltas)) return True if test_ragged_chunks(100): print('ok')

乗算をrange呼び出しにエクスポートすることで、これをわずかにより効率的にすることができますが、以前のバージョンはより読みやすい（そしてDRYer）と思います。

def ragged_chunks(seq, chunks): size = len(seq) start = 0 for i in range(size, size * chunks + 1, size): stop = i // chunks yield seq[start:stop] start = stop

dalloliogm · Answer

numpy.split を見てください：

>>> a = numpy.array([1,2,3,4]) >>> numpy.split(a, 2) [array([1, 2]), array([3, 4])]

Danil · Answer

5つの部分に分割する場合：

p1, p2, p3, p4, p5 = np.split(df, 5)

liscju · Answer

リスト内包表記の使用：

def divide_list_to_chunks(list_, n): return [list_[start::n] for start in range(n)]

Chłop Z Lasu · Answer

わかりやすい私のソリューション

def split_list(lst, n): splitted = [] for i in reversed(range(1, n + 1)): split_point = len(lst)//i splitted.append(lst[:split_point]) lst = lst[split_point:] return splitted

そして、このページで一番短いワンライナー（私の女の子が書いた）

def split(l, n): return [l[int(i*len(l)/n):int((i+1)*len(l)/n-1)] for i in range(n)]

jreyes · Answer

「残りの」要素をすべてのチャンクに均等に分散させる別のバリエーションがあります。この実装では、プロセスの開始時に大きなチャンクが発生します。

def chunks(l, k): """ Yield k successive chunks from l.""" if k < 1: yield [] raise StopIteration n = len(l) avg = n/k remainders = n % k start, end = 0, avg while start < n: if remainders > 0: end = end + 1 remainders = remainders - 1 yield l[start:end] start, end = end, end+avg

たとえば、14個の要素のリストから4つのチャンクを生成します。

>>> list(chunks(range(14), 4)) [[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10], [11, 12, 13]] >>> map(len, list(chunks(range(14), 4))) [4, 4, 3, 3]

Ilya Tuvschev · Answer

job's answerと同じですが、チャンクの数よりも小さいサイズのリストを考慮します。

def chunkify(lst,n): [ lst[i::n] for i in xrange(n if n < len(lst) else len(lst)) ]

n（チャンクの数）が7で、lst（分割するリスト）が[1、2、3]の場合、チャンクは[[0]、[1]ではなく[[0]、[1]、[2]] ]、[2]、[]、[]、[]、[]]

Carlos del Ojo · Answer

以下も使用できます。

split=lambda x,n: x if not x else [x[:n]]+[split([] if not -(len(x)-n) else x[-(len(x)-n):],n)][0] split([1,2,3,4,5,6,7,8,9],2) [[1, 2], [3, 4], [5, 6], [7, 8], [9]]

Akavall · Answer

別の方法はこのようなものです。ここでの考え方は、ハタを使用することですが、Noneを取り除きます。この場合、リストの最初の部分の要素からすべての「small_parts」が形成され、リストの後半の部分から「larger_parts」が形成されます。「大きなパーツ」の長さはlen（small_parts）+ 1です。xを2つの異なるサブパーツと見なす必要があります。

from itertools import izip_longest import numpy as np def grouper(n, iterable, fillvalue=None): # This is grouper from itertools "grouper(3, 'ABCDEFG', 'x') --> ABC DEF Gxx" args = [iter(iterable)] * n return izip_longest(fillvalue=fillvalue, *args) def another_chunk(x,num): extra_ele = len(x)%num #gives number of parts that will have an extra element small_part = int(np.floor(len(x)/num)) #gives number of elements in a small part new_x = list(grouper(small_part,x[:small_part*(num-extra_ele)])) new_x.extend(list(grouper(small_part+1,x[small_part*(num-extra_ele):]))) return new_x

設定方法は、タプルのリストを返します。

>>> x = range(14) >>> another_chunk(x,3) [(0, 1, 2, 3), (4, 5, 6, 7, 8), (9, 10, 11, 12, 13)] >>> another_chunk(x,4) [(0, 1, 2), (3, 4, 5), (6, 7, 8, 9), (10, 11, 12, 13)] >>> another_chunk(x,5) [(0, 1), (2, 3, 4), (5, 6, 7), (8, 9, 10), (11, 12, 13)] >>>

grafi71 · Answer

このコードは私のために機能します（Python3互換）：

def chunkify(tab, num): return [tab[i*num: i*num+num] for i in range(len(tab)//num+(1 if len(tab)%num else 0))]

例（bytearray typeの場合、list sでも機能します）：

b = bytearray(b'\x01\x02\x03\x04\x05\x06\x07\x08') >>> chunkify(b,3) [bytearray(b'\x01\x02\x03'), bytearray(b'\x04\x05\x06'), bytearray(b'\x07\x08')] >>> chunkify(b,4) [bytearray(b'\x01\x02\x03\x04'), bytearray(b'\x05\x06\x07\x08')]

Anthony Manning-Franklin · Answer

これは、長さが<= n、> = 0のチャンクを提供します

def

 chunkify(lst, n): num_chunks = int(math.ceil(len(lst) / float(n))) if n < len(lst) else 1 return [lst[n*i:n*(i+1)] for i in range(num_chunks)]

例えば

>>> chunkify(range(11), 3) [[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10]] >>> chunkify(range(11), 8) [[0, 1, 2, 3, 4, 5, 6, 7], [8, 9, 10]]

swateek · Answer

#!/usr/bin/python first_names = ['Steve', 'Jane', 'Sara', 'Mary','Jack','Bob', 'Bily', 'Boni', 'Chris','Sori', 'Will', 'Won','Li'] def chunks(l, n): for i in range(0, len(l), n): # Create an index range for l of n items: yield l[i:i+n] result = list(chunks(first_names, 5)) print result

これから選んだ link 、そしてこれが私を助けた。定義済みのリストがありました。

&#194;ngelo Polotto · Answer

ほとんどのソリューションを試しましたが、私のケースでは機能しませんでした。そのため、ほとんどのケースとあらゆるタイプの配列で機能する新しい関数を作成しました。

import math def chunkIt(seq, num): seqLen = len(seq) total_chunks = math.ceil(seqLen / num) items_per_chunk = num out = [] last = 0 while last < seqLen: out.append(seq[last:(last + items_per_chunk)]) last += items_per_chunk return out

Cipher.Chen · Answer

私はこのケースで自分でコードを書きました：

def chunk_ports(port_start, port_end, portions): if port_end < port_start: return None total = port_end - port_start + 1 fractions = int(math.floor(float(total) / portions)) results = [] # No enough to chuck. if fractions < 1: return None # Reverse, so any additional items would be in the first range. _e = port_end for i in range(portions, 0, -1): print "i", i if i == 1: _s = port_start else: _s = _e - fractions + 1 results.append((_s, _e)) _e = _s - 1 results.reverse() return results

divide_ports（1、10、9）が返されます

[(1, 2), (3, 3), (4, 4), (5, 5), (6, 6), (7, 7), (8, 8), (9, 9), (10, 10)]