: 2 canna を使う最低限の設定と使い方
: cannaによる日本語入力
: cannaによる日本語入力
UNIX環境では、変換サーバー/変換クライアント/各アプリケーションの3者が日
本語入力に関係していて、変換サーバーと変換クライアントは、別なマシンにあっ
てもよい。これは、クライアント機が変わっても、同じ辞書を参照できるように
するための仕組みである。これら3者のおおまかな関係を簡単に図示すると、次
のようになる。この図は、かなり簡略化しており、もっと詳細な関係は、
こちら
で見ることが出来る。
図 1:
UNIXにおける日本語入力の概略図
|
- 変換サーバー
-
変換クライアントから 「かな」 などを受取り、「漢字」に変換して返す役割を
持つ。 Wnn 1 の jserver、 Canna 2 の cannaserver など。辞書の豊富さ、変換のア
ルゴリズム、学習機能などが変換効率に影響する。
- 変換クライアント
-
ユーザーの入力を受け、変換サーバと通信して漢字にしてアプリケーショ
ンに渡す役割。ユーザーインタフェースを受け持ち,使い勝手に大きな影響を
持つ。kinput2、 xwnmo3、
uum4、
canuum5、 skkinput6など。
- アプリケーション
-
X7上の国際化したアプリケーションは、変換クライアントと通信する能力
をもつ(tgif,mozillaなど)。また、emacs のように、アプリケーションに
よっては、自前で変換クライアント機能 ( たまご8や canna) を持ち、直接、変換サーバーと通信するものもある。
- 変換サーバーと変換クライアントとの関係
-
どの変換サーバーと通信できるかは、変換クライアントによって決まって
いる。uumやxwnmoは Wnn と、canuumは Canna と通信できる。kinput2は、
コンパイル時の指定で、Canna、Wnn(FreeWnn, Wnn6, Wnn7)、Sj3と通信可能
になる。
- 変換クライアントとアプリケーションとの関係
-
Xでの変換クライアントとアプリケーションが通信する方法には、
歴史的にいくつかのプロトコルが用いられて来た。
例えば、変換クライアントである kinput2 は、manual page によれば、
kinput protocol
kinput2 protocol
Matsushita jinput protocol
Sony xlc protocol
XIMP protocol
X Input Method Protocol (X Consortium standard)
のプロトコルに対応している。また、X でのお絵書きソフトである tgif は、
"xcin", "chinput","kinput2", "xim" の4つのプロトコルに対応している。
現在は、XIM(X Input Method)プロトコルがほぼ標準になってきたので、
国際化したほとんどのアプリケーションは、
XIM に対応していると考えて間違いない。
XIM で実際に使う変換クライアントは、通常、環境変数
XMODIFIERS で指定する。
一般的に、日本語入力は次の手順で行われる。
- 通常のアルファベット入力(入力したキーボードの文字がそのまま出力さ
れる状態)から、ある特別なキー(変換起動キーと呼ぶことにする)を押す
と、日本語入力が ON になる。変換起動キーは変換クライアントに依存するが、
kinput2 では SHIFT + Space または Ctrl + o (おー)、tamago4 では Ctrl +
\に割り当てられている。
- 日本語入力が ON になると、キーボードからの入力を、変換クライアン
トが一旦奪って、かな や アルファベット に変換してから、画面に表示する。
この状態をフェンスモードと呼ぶ。
- フェンスモードで Space キーを押すと、変換クライアントは、
フェンス内の文字列を変換サーバーに送る。
変換サーバーは、受け取った文字列を、
文節を区切るなどして漢字に変換し、結果を変換クライアントに返し、
変換クライアントは結果を画面に表示する。
この状態を、漢字変換モードまたは単に変換モードと呼ぶ。
漢字変換モードでは、文節毎に他の候補を選んだり、
文節を伸ばしたり縮めたりしながら、
目的とする日本語にインタラクティブに変換する。
漢字変換モードで、Return キーを押すと、文字列を確定して、
日本語入力 ON の状態に戻る。
- 日本語入力が ON の状態である特別なキー
(変換終了キーと呼ぶことにする) を押すと、
日本語入力が OFF になり、アルファベット入力に戻る。
通常、変換終了キーは、変換起動キーと同じ場合が多い。
以上の操作のように、ユーザーの側から見ると、日本語入力システムはひとつに
見えるかもしれないが、内部的には、変換クライアントと変換サーバーの役割は
明確に分離している。例えば、「ぁぃぅぇぉ]という「かな]を出したり、"ABC"
と入力したとき、"ABC" 、 "ABC"、"あBC"、"あBC" のどれをフェンスモー
ドに表示するかは、変換クライアントの仕事であり、
その部分を使い易くするためには、変換クライアントのカスタマイズが必要である。
一方、ある単語が漢字に変換できなかったり、
自分で良く使う単語が候補の最後の方に現れるのは、変換サーバーの所為であり、
変換サーバーの辞書を賢くしたり、変換サーバーに頻度学習を行わせる必要がある。
- ... Wnn1
- 京大とオムロンとの共同開発。Version4 までは、フ
リーソフトウェアとして公開されていたが、現在は、Wnn6, Wnn7 は商用で
市販されている。私の名前は中野です、を一発で変換できるようにするのを目標
として開発され、それが Wnn の語源。
- ... Canna2
- 元々
は NECで開発され、現在は、sourceforge.jp
上で開発が続けられている。
- ... xwnmo3
- Wnn用の X 上の変換クライアント。
- ...
uum4
- Wnn用の文字端末用変換クライアント。wnnを180°回転させた。
- ...
canuum5
- Canna 用の uum
- ... skkinput6
- SKK用の X 上の変換ク
ライアント
- ...
X7
- X Window system のこと。略称は、X または、X11 で、X window
とは呼ばない。
- ... たまご8
- Wnn の変換クラ
イアント。たくさん
またせてご めんなさい、の頭文字をとった。その英訳で egg
とも呼ばれる。
: 2 canna を使う最低限の設定と使い方
: cannaによる日本語入力
: cannaによる日本語入力