web-dev-qa-db-ja.com

リストからランダムに50項目を選択して、ファイルに書き込みます

これまで、ファイルをインポートし、新しいファイルを作成し、リストをランダム化する方法を見つけました。

リストから50個のアイテムだけをランダムに選択してファイルに書き込むのに問題がありますか?

def randomizer(input,output1='random_1.txt',output2='random_2.txt',output3='random_3.txt',output4='random_total.txt'):

#Input file 
    query=open(input,'r').read().split()
    dir,file=os.path.split(input)

    temp1 = os.path.join(dir,output1)
    temp2 = os.path.join(dir,output2)
    temp3 = os.path.join(dir,output3)
    temp4 = os.path.join(dir,output4)


    out_file4=open(temp4,'w')

    random.shuffle(query)

    for item in query:
        out_file4.write(item+'\n')   

合計ランダム化ファイルが

example:

random_total = ['9','2','3','1','5','6','8','7','0','4']

最初のランダムセット3、2番目のランダムセット3、3番目のランダムセット3の3つのファイル(out_file1 | 2 | 3)が必要です(この例では、作成するファイルには50が必要です)

random_1 = ['9','2','3']
random_2 = ['1','5','6']
random_3 = ['8','7','0']

したがって、最後の「4」は含まれず、問題ありません。

ランダム化したリストから50を選択するにはどうすればよいですか?

さらに良いことに、元のリストから50をランダムに選択するにはどうすればよいですか?

102
O.rka

リストがランダムな順序である場合、最初の50個だけを取得できます。

そうでなければ、使用

import random
random.sample(the_list, 50)

random.sampleヘルプテキスト:

sample(self, population, k) method of random.Random instance
    Chooses k unique random elements from a population sequence.

    Returns a new list containing elements from the population while
    leaving the original population unchanged.  The resulting list is
    in selection order so that all sub-slices will also be valid random
    samples.  This allows raffle winners (the sample) to be partitioned
    into grand prize and second place winners (the subslices).

    Members of the population need not be hashable or unique.  If the
    population contains repeats, then each occurrence is a possible
    selection in the sample.

    To choose a sample in a range of integers, use xrange as an argument.
    This is especially fast and space efficient for sampling from a
    large population:   sample(xrange(10000000), 60)
211
John La Rooy

ランダムなアイテムを選択する簡単な方法の1つは、シャッフルしてからスライスすることです。

import random
a = [1,2,3,4,5,6,7,8,9]
random.shuffle(a)
print a[:4] # prints 4 random variables
30
Mani

random.choice()がより良いオプションだと思います。

import numpy as np

mylist = [13,23,14,52,6,23]

np.random.choice(mylist, 3, replace=False)

関数は、リストからランダムに選択された3つの値の配列を返します

23
Moeen MH