この項目は3つの別々の項目のようになってしまいました。
文字処理
1バイト文字と2バイト文字
 コンピュータ内で扱われている文字にはすべて番号がつけられています。コンピュータは何でも二進数によって処理しますが、二進数の一桁を1ビット(1 bit)、それが8桁集まった単位を1バイト(1 byte)と呼びます。ですから、1バイトは28(=256)で十進数の0から256までの数字を表すことができます。これを文字の番号につかうと1バイトで256の異なった番号を扱えることになります。世界中のほとんどの言語の文字種は256字以内ですから、1バイトで十分なのですが、漢字を使う中国語や日本語の場合これでは足りません。そこで、もう1バイト増やして2バイトで文字の番号を表しています。(文字コード参照)
日本語入力・インプットメソッド
 使用文字種の多い日本語の入力も印欧語に比べるとはるかに複雑です。現在、最も一般的な入力の方法はキーボードを使うことですが、キーボードには100余りのキーしかありません。そこで、多くの人は仮名をローマ字で入力し、さらに漢字変換をすることで日本語の文を入力しています。この一連の処理を行っているのがインプットメソッド(IM)と呼ばれるプログラムです。(例 MS-IME、ことえり、ATOKなど)ワープロソフトや表計算ソフトや描画ソフトなど使っているアプリケーションにかかわらず、日本語を入力するときはインプットメソッドが処理しています。ですから、インプットメソッドは基本ソフト(OS)とアプリケーションの中間に位置していると理解しておいてください。音韻の数が少なく同音異義語が多く、しかもスペースで単語を区切ることをしない日本語ではインプットメソッドの性能は入力効率に大きな影響を与えます。(インプットメソッドは以前はFEPとも呼ばれていました。)
PDF(Portable Document Format)
 Adobe社のAcrobatというアプリケーションで用いられるファイル形式のことを指します。この形式を使うとWindows、Mac、Linuxなどのどのプラットフォームでも閲覧可能なファイルを作ることができるので、文書をインターネット上で公開したり他の人と交換したりするのに便利です。また、フォントをPDFファイルの中に埋め込むこともできるので、日本語のフォントを持たないコンピュータ上でもファイルの中の日本語だけは正しく読めるということが可能です。PDFファイルを開けるためには、Acrobat Readerという無料のアプリケーションが必要です。このプログラムはインターネットから簡単に入手できます。