LinuxでのWindows改行の削除（sedとawk）

Question

Vimで^ Mとして表示される（行末ではなく）フィールドの中央に改行文字が不適切に配置された区切りファイルがいくつかあります。これらは、MSSQLデータベースのfreebcp（Centos 6）エクスポートから発生します。データを16進数でダンプすると、\ r パターンが表示されます。

$ xxd test.txt | grep 0d0a 0000190: 3932 3139 322d 3239 3836 0d0a 0d0a 7c43

私はawkでそれらを削除できますが、sedで同じことを行うことはできません。

これはawkで機能し、改行を完全に削除します。

awk 'gsub(/
/,""){printf $0;next}{print}'

ただし、これはsedでは行われず、改行がそのまま残ります。

sed -i 's/
//g'

これは効果がないように見えます：

sed -i 's/
//g'

Sed式（ctrl + v、ctrl + m）で^ Mを使用しても機能しないようです。

この種のタスクでは、sedは簡単に理解できますが、私は両方の詳細を学んでいます。 sedを不適切に使用していますか、または制限がありますか？

chepner · Accepted Answer

sedの一部のバージョンは\rを文字として認識しません。ただし、bash機能を使用してその制限を回避できます。

echo $string | sed $'s/\r//'

ここでは、bashをコマンドとしてsedに渡す前に、$'...'構造内の実際のキャリッジリターン文字で '\ r'を置き換えます。（bashを使用すると仮定すると、他のシェルにも同様の構造が必要です。）

kev · Answer

コマンドラインツールdos2unixを使用できます

dos2unix input

または、trコマンドを使用します。

tr -d '
' <input >output

実際、vimでファイル形式の切り替えを行うことができます。

:e ++ff=dos :w ++ff=unix :e!

:e ++ff=dos :set ff=unix :w

ファイル内のシーケンスを削除する場合は、vimで次のコマンドを試してください。

:e ++ff=unix " <-- make sure open with UNIX format :%s/
//g " <-- remove all 
 :w " <-- save file

awkソリューションは正常に機能します。別の2つのsedソリューション：

sed '1h;1!H;$!d;${g;s/
//g}' input sed ':A;/
$/{N;bA};s/
//g' input

Steven Penny · Answer

別の方法

awk 1 RS='
' ORS=

Sergiy Dolnyy · Answer

sed -e 's/\r//g' input_file

これは私のために動作します。 -iコマンドの代わりに-eの違い。

また、プラットフォームごとに動作が異なることを説明しました。私は：sed --version This is not GNU sed version 4.0