2015-08-30から1日間の記事一覧

[Java][文字コード] Unicode 正規化と、文字列の正規表現と関数を用いた置換

Java の標準ライブラリに java.text.Normalizer という Unicode 正規化を行うクラスがあります。 濁点・半濁点を合成・分解したりするのに便利なのですが、JIS X 0208 の「Å(U+212B)」を「上リング付きA(U+00C5)」に変換したり、JIS X 0213 のギリシャ文…