u’-‘ と u’u2013’ の違いは何でしょうか?

投稿者: Anonymous

python2 における unicode に関して質問です。
u’-‘ と u’u2013’ の違いは何でしょうか。(2013 は – のコードポイントだと思います)

print u'-'      #=> -
print u'u2013' #=> -
u'-' == u'u2013' #=> False

解決

u'-' はコードポイント 0x002D の文字で、普通にキーボードで入力できるハイフン・マイナス記号です。ASCII コードの 0x2D に対応する文字です。

u'u2013' は、見ての通り、コードポイント 0x2013 の文字で、en ダッシュと呼ばれるものです。具体的な用途はよく知らないのですが、Wikipedia のダッシュ (記号)の項によると

  • 区間や範囲を表す。
    たとえば10-20と書かれていた場合、これがenダッシュ (10–20) なら「10から20まで」である。これに対してハイフン (10‐20) なら「10の20」、マイナス (10−20)なら「10引く20」である

だそうです。

回答者: Anonymous

Leave a Reply

Your email address will not be published. Required fields are marked *