web-dev-qa-db-ja.com

Wordの各文字を別々の列/セルに書き込むcsv.writer

目的:modelsのすべての行内のアンカータグからテキストを抽出し、csvに配置します。

私はこのコードを試しています:

with open('Sprint_data.csv', 'ab') as csvfile:
  spamwriter = csv.writer(csvfile)
  models = soup.find_all('li' , {"class" : "phoneListing"})

  for model in models:

      model_name = unicode(u' '.join(model.a.stripped_strings)).encode('utf8').strip()
      spamwriter.writerow(unicode(u' '.join(model.a.stripped_strings)).encode('utf8').strip())

Csvの各セルに含まれる文字が1つだけであることを除いて、正常に機能しています。

このような:

|  S  |  A  |   M  |   S  |   U   |  N  |   G   |

の代わりに:

|SAMSUNG|

もちろん、私は何かが欠けています。でも何?

41
moaglee

writerowはシーケンスを受け入れます。単一の文字列を与えているので、それをシーケンスとして扱い、文字列は文字のシーケンスのように機能します。

この行には他に何が必要ですか?何もない?その場合、1つのアイテムのリストにします。

_spamwriter.writerow([u' '.join(model.a.stripped_strings).encode('utf8').strip()])
_

(ところで、すでにUnicode区切り文字で結合しているため、unicode()呼び出しは完全に不要です。)

14
Eevee

.writerow()はシーケンス(_''_、_()_、_[]_)を必要とし、各インデックスを行の独自の列に順番に配置します。目的の文字列がシーケンス内のアイテムでない場合、writerow()は文字列内の各文字を反復処理し、それぞれが個別のセルでCSVに書き込まれます。

後_import csv_

これがリストの場合:

_myList = ['Diamond', 'Sierra', 'Crystal', 'Bridget', 'Chastity', 'Jasmyn', 'Misty', 'Angel', 'Dakota', 'Asia', 'Texxxas', 'Desiree', 'Monique', 'Tatiana']


listFile = open('Strippers.csv', 'wb')
writer = csv.writer(listFile)
for item in myList:
    writer.writerow(item)
_

上記のスクリプトは、次のCSVを生成します:strippers.csv

_D,i,a,m,o,n,d
S,i,e,r,r,a
C,r,y,s,t,a,l
B,r,i,d,g,e,t
C,h,a,s,t,i,t,y
J,a,s,m,y,n
M,i,s,t,y
A,n,g,e,l
D,a,k,o,t,a
A,s,i,a
T,e,x,x,x,a,s
D,e,s,i,r,e,e
M,o,n,i,q,u,e
T,a,t,i,a,n,a
_

独自のセルに各名前が必要な場合、解決策は単純に文字列(item)をシーケンスに配置することです。ここでは、角括弧_[]_を使用します。 :

_listFile2 = open('Strippers2.csv', 'wb')
writer2 = csv.writer(listFile2)
for item in myList:
    writer2.writerow([item])
_

.writerow([item])を含むスクリプトは、目的の結果を生成します:Strippers2.csv

_Diamond
Sierra
Crystal
Bridget
Chastity
Jasmyn
Misty
Angel
Dakota
Asia
Texxxas
Desiree
Monique
Tatiana
_
67
mdandr

リスト記号で囲むだけです(つまり[]

writer.writerow([str(one_column_value)])
3
Reihan_amn

これは通常私が使用するソリューションです:

import csv
    with open("output.csv", 'w', newline= '') as output:
        wr = csv.writer(output, dialect='Excel')
        for element in list_of_things:
            wr.writerow([element])
        output.close()

これにより、すべてのリスト要素の出力が単一の行ではなく単一の列に表示されます。

ここでのキーポイントは、リストを反復処理し、 '[list]'を使用してcsvwriterシーケンスの問題を回避することです。

これが役に立つことを願っています!

1
Steve B