web-dev-qa-db-ja.com

「nbsp;」を削除する方法from Java string

Java文字列に_" "_の文字列があり、プログラムがBuffered Readerオブジェクトを使用してアクセスするテキストファイルから取得しました。string.replaceAll(" ","")を試しましたが、作業。

何か案は?

_cleaned = cleaned.replace(" "," ");
_
38
Greg
cleaned = cleaned.replace("\u00a0","")
84
Nitin Phadnis

あなたが言ったのと同じ方法:

String cleaned = s.replace(" "," ");

わたしにはできる。

7
Manuel Selva

これは2段階のプロセスです。

strLineApp = strLineApp.replaceAll("&"+"nbsp;", " "); 
strLineApp = strLineApp.replaceAll(String.valueOf((char) 160), " ");

これは私のために働いた。それがあなたにも役立つことを願っています!

6
Deep Sehgal

Apache commonsからHTMLをエスケープ解除する簡単なソリューションがあります。

StringEscapeUtils.unescapeHtml("")

必要に応じてHTMLをエスケープすることもできます。

StringEscapeUtils.escapeHtml("")
2
RichardK

JSoup library:を使用できます

String date = doc.body().getElementsByClass("Datum").html().toString().replaceAll(" ","").trim();
0
michdraft

文字列は不変ですので、あなたがする必要があります

string = string.replaceAll(" ","")

同じ問題が発生しました。必要な要素の内部HTMLに「&nbsp」があり、アサーションが失敗しました。質問は回答を受け入れていないので、次のことを提案します。

String string = stringwithNbsp.replaceAll("\n", "");

P.S:ハッピーテスト:)

0
Stroev