sql >> データベース >  >> NoSQL >> MongoDB

同じ単語ですが、Unicode文字が異なります

    あなたが遭遇する問題は、ユニコードが同じシンボルを構成するための複数の方法を可能にするということです。 Pythonモジュールunicodedata 関数normalizeを提供します これにより、Unicode表現を固定のform に変換できます。 (例:NFC)

    from unicodedata import normalize
    
    S1 = b'\xc4\x83\xcc\x83'.decode('UTF-8')
    S2 = b'\xe1\xba\xb5'.decode('UTF-8')
    
    print(normalize('NFC', S1).encode('UTF-8'))
    print(normalize('NFC', S2).encode('UTF-8'))
    

    あなたの例では、メモ帳がNFCを使用しているのに対し、トリップアドバイザーはNFD形式で表示されています。




    1. 例外:BSONObjサイズ:-286331154(0xEEEEEEEE)が無効です。サイズは0から16793600(16MB)の間でなければなりません

    2. redisテンプレートを使用してRedisからすべてのキーを取得する方法

    3. C#でMongoDBネストされた$elemMatchクエリを実装する方法

    4. --authenticationDatabaseadminなしでmongodbインスタンスに接続します