web-dev-qa-db-ja.com

NSString:文字列からUTF-8アクセントを削除する簡単な方法?

たとえば、文を変更したい:

Êtreou ne pasêtre。 Cééititlà-bas。

になるでしょう:

Etre ou ne pas etre。 C'etait la-bas。

NSStringでこれを行う簡単な方法はありますか?または、各文字をチェックしてこれを自分で開発する必要がありますか?

44
Rob
NSString *str = @"Être ou ne pas être. C'était là-bas.";
NSData *data = [str dataUsingEncoding:NSASCIIStringEncoding allowLossyConversion:YES];
NSString *newStr = [[NSString alloc] initWithData:data encoding:NSASCIIStringEncoding];
NSLog(@"%@", newStr);

...または、代わりにNSUTF8StringEncodingを使用してみてください。

エンコードタイプのリスト:

https://developer.Apple.com/documentation/foundation/nsstringencoding


FTRだけが、この素晴らしい答えを書くための1行の方法です。

yourString = [[NSString alloc]
  initWithData:
    [yourString dataUsingEncoding:NSASCIIStringEncoding allowLossyConversion:YES]
  encoding:NSASCIIStringEncoding];
58
Luke

マット・トンプソンはこれを NSHipster で、また WWDC 2013セッション228 で説明しました。

TL; DR

NSMutableString *str = [@"Être ou ne pas être. C'était là-bas." mutableCopy];
CFStringTransform((__bridge CFMutableStringRef)string, NULL, kCFStringTransformStripCombiningMarks, NO);

トリックを行う必要があります、それは私のためにうまくいった。

Caveatコメントの多くの人々はこれが受け入れられた答えであるべきだと言っているので、私はこの方法に警告を与えたいです。この方法は非常に遅く、大量の文字列/データを変換する必要がある場合は注意して使用する必要があります

48
tapi

やってみました

[string stringByFoldingWithOptions:NSDiacriticInsensitiveSearch locale:[NSLocale currentLocale]]

または

Boolean CFStringTransform (
   CFMutableStringRef string,
   CFRange *range,
   CFStringRef transform,
   Boolean reverse
);

CFStringTransform変換識別子

NSMutableString *string = ...;
CFMutableStringRef stringRef = (__bridge CFMutableStringRef)string;
CFStringTransform(stringRef, NULL, kCFStringTransformToLatin, NO);
NSLog(@"%@", string);
25
Regexident

Swiftでそのようにできると言うだけの更新:

"Être ou ne pas être. C'était là-bas.".stringByFoldingWithOptions(NSStringCompareOptions.DiacriticInsensitiveSearch, locale: NSLocale.currentLocale())

-> "Etre ou ne pas etre。C'etait la-bas。"

16
valR

以下を使用したソリューション間のiPhone 6 iOS 9.0シミュレーターでSwift 2.0を使用したパフォーマンステスト:

  • CFStringTransform(タスク1)
  • stringByFoldingWithOptions(タスク2)

タスク2は一貫して高速です。例:

Task 1 took 9.49736100435257 seconds.
Task 2 took 1.96649599075317 seconds.

ここでテスト:

    let timer = ParkBenchTimer()
    for _ in 1...1000000 {
        let mStringRef = NSMutableString(string: "Être ou ne pas être. C'était là-bas.") as CFMutableStringRef
        CFStringTransform(mStringRef, nil, kCFStringTransformStripCombiningMarks, false)
        String(mStringRef)
    }
    print("Task 1 took \(timer.stop()) seconds.")

    let timer2 = ParkBenchTimer()
    for _ in 1...1000000 {
        "Être ou ne pas être. C'était là-bas.".stringByFoldingWithOptions(NSStringCompareOptions.DiacriticInsensitiveSearch, locale: NSLocale.currentLocale())
    }
    print("Task 2 took \(timer2.stop()) seconds.")

KlaasによるParkBenchTimer: https://stackoverflow.com/a/26578191/1097106

9
svrs

Swift(遊び場でテスト済み)

//String+StripCombiningMarks.Swift

extension String {
    /// strip combining marks (accents or diacritics)
    var stripCombiningMarks: String {
        let mStringRef = NSMutableString(string: self) as CFMutableString
        CFStringTransform(mStringRef, nil, kCFStringTransformStripCombiningMarks, false)
        return mStringRef as String
    }
}

使用法:

let umlaut = "äöüÄÖÜ"
let stripped = umlaut.stripCombiningMarks //aouAOU
5
Peter Kreinz

ここに完全なコードがあります。関数stringbyfoldignWithOptionsを使用します。

NSString *str1=@"Être ou ne pas être C'était là-bas"; NSString *str2=[str1 stringByFoldingWithOptions:NSDiacriticInsensitiveSearch locale:[NSLocale systemLocale]]; NSLog(@"%@",str2);

3
Hitesh Agarwal

SwiftバージョンのCFStringTransformソリューションが必要な場合:

let stripAccentAndDiacritics: (String) -> String = {
    var mStringRef = NSMutableString(string: $0) as CFMutableStringRef
    CFStringTransform(mStringRef, nil, kCFStringTransformStripCombiningMarks, Boolean(0))
    return String(mStringRef)
}
1
clmntcrl