Content of uim/2008/01/08/Telex at 2008/01/08 01:28:57 JST
View diff from current version
隣の席に座っているヴェトナム人留学生とimのセッティングをしよう、 という段になって、 「uimでもTiếng Việtが入力できるぜ〜」と自慢したところ、 [[Wikipedia:VIQR]]は知らないというので、 調べてみたところ、 他に[[Wikipedia:Telex_(IME)]]や[[Wikipedia:VNI]]があるそうな。 で、uimにTelexを載っけようっていうわけ。 scm/viqr.scmのテーブルを参考に、ヘコヘコ手打ちしながら、 [[Wikipedia:Telex_(IME)]]をさらに読んでみると、 Tone markings(声調?)なんて項目があって、 文字変換する側からすると、直前の子音を飛び越して母音にアクセントがついたり、 逆に外したりしてしまうように見える†1。 で、これを実装するには、普通のテーブル変換じゃどうやっても無理。 なんでuimにVIQRしかないか納得(VNIも恐らくTelexと同様)。 generic.scmを使わないでimを作るのは面倒だもの。 これはきちんとstate machineを作ってやらないといけないなあ。 ということで次のcommitはtelex.scmになりそう。 ちなみにテーブル変換版: [[files:uim-telex-table.diff]]。 これだけでもまあ使えるといえば使える。 gtk-im-viに含まれるものと同等の性能のはず。 ---- †1: もちろん、母音の直後に入れてやってもよい。 "sawcs"も"sawsc"もどちらも"sắc"に変換されて、 後者はテーブル変換のアルゴリズムが適用可能。 でも対症療法っぽくてやだなあ。