Misc Change Log

`OpenBSD で scheme のアプリ開発' みたいなことをやってます。

2004-12-18

Sumibi

http://sourceforge.jp/projects/sumibi/

via: http://pc5.2ch.net/...

Markov model の漢字入力エンジン。

Sumibiは統計的アプローチを使ったローマ字漢字変換エンジンです。Internet上にある無数のドキュメントをコーパスとして利用し、辞書を育てて楽しむ新感覚の漢字変換エンジンの開発を目指します。

いまのところ cvs 版のみ。

マニュアル見ただけだけど、 わかち書きを bigram するだけじゃあたぶん無理が出てくるんじゃないかなあ(みじんこですら手抜き trigram だよ)。 変な候補が続出する悪寒。SQL を要求するのもちょっとおおげさっぽ。

Posted at 02:44 | Permalink | Category | Comments