トークンとコンテキストウィンドウ

AIが文章を処理する単位である「トークン」と、一度の会話で記憶・処理できる情報量の上限を示す「コンテキストウィンドウ」について解説します。長文を入力するとAIが指示を忘れてしまうメカニズムなど、システムの物理的な制限を理解し、トラブルを防ぐ方法を学びます。

記事区分：用語カテゴリ：業務でのAI活用

公開日：2026/05/07

1. AIには「読める文章量」と「記憶力」に限界がある

生成AIの性能は日々進化し、まるで人間のように自然な対話ができるようになりました。しかし、AIは無制限に文章を読み込んだり、無限に長い会話を記憶し続けたりできるわけではありません。

AIを業務で効率的に使いこなすためには、「ペルソナ指定」や「コンテキストの付与」といった入力のテクニックだけでなく、AIというシステムが持つ**「物理的な処理の限界」**を知っておく必要があります。その限界を理解するためのキーワードが、「トークン（Token）」と「コンテキストウィンドウ（Context Window）」です。

2. トークン（Token）：AIにとっての「言葉のピース」

私たちが文章を読むとき、「文字」や「単語」という単位で意味を理解します。しかし、AIは人間と同じように文字を認識しているわけではありません。AIは入力されたテキストを、処理しやすい細かいデータのかけらに分割して読み込んでいます。このAIにとっての文字のカウント単位を「トークン（Token）」と呼びます。

トークンの区切られ方は言語によって異なります。例えば英語の場合、おおよそ「1単語＝1トークン（またはそれ以下）」として効率よく分割されます。一方で日本語の場合、ひらがな、カタカナ、漢字など複雑な文字体系を持っているため、1つの単語が複数のトークンに細かく分割されることが多く、英語よりもトークン数を多く消費しやすい傾向にあります。

細かな計算方法を覚える必要はありません。実務上は、**「AIの世界における文字数制限の単位は、文字数ではなくトークン数で計算されている」**と理解しておけば十分です。多くのAIサービスにおいて「1回の入力は〇〇トークンまで」といった制限が設けられているのはこのためです。

3. コンテキストウィンドウ：AIの「作業机の広さ」

トークンと並んで極めて重要な概念が「コンテキストウィンドウ（Context Window）」です。これは、AIが1回の処理（対話）において、同時に考慮・記憶できるトークンの最大上限数のことを指します。

このコンテキストウィンドウを、人間の**「作業机の広さ」**に例えてみましょう。

コンテキストウィンドウが狭いAIは、小さな学習机しか持っていません。数枚の資料（短いプロンプト）を広げただけで机はいっぱいになってしまいます。一方、最新の法人向けAIモデルの多くは、巨大な会議用テーブルのような広いコンテキストウィンドウを持っており、分厚いマニュアルや長時間の議事録をまるごと机の上に広げて、全体を見渡しながら回答を作成することができます。

ここで絶対に覚えておくべき注意点があります。コンテキストウィンドウ（机の上）に乗せられる情報量は、「あなたが今入力したプロンプト（指示文）」だけではありません。「AIが生成した過去の回答」や、「これまでのチャット画面上のやり取り（履歴）のすべて」の合計トークン数が、この上限（机の広さ）に収まっている必要があるのです。

4. なぜAIは突然「前提条件」を忘れるのか？

実務でAIを利用していると、次のようなトラブルに遭遇することがあります。

「チャットの最初は、指示通りにプロの編集者のような丁寧な言葉遣いで回答していたのに、何度もやり取り（壁打ち）を繰り返しているうちに、突然タメ口になったり、最初にお願いした出力フォーマットを無視し始めたりした」

これは、AIが反抗しているわけでもシステムが壊れたわけでもありません。原因は非常にシンプルで、**「長時間のやり取りによってチャットの履歴がコンテキストウィンドウ（作業机の広さ）の限界を超えてしまったため、一番古い記憶から順番に消去（忘却）されてしまった」**からです。

AIはチャットの履歴を常に読み込み直しながら「文脈」を維持していますが、トークン数が上限に達すると、新しい情報を机に乗せるために、古い情報を机から押し出して捨ててしまいます。数十ページに及ぶPDFを読み込ませて分析させた直後に、「ところで、一番最初のページに書いてあったあの件だけど…」と質問しても、AIがトンチンカンな回答をするのは、すでにその最初のページの情報が机から押し出されてしまっているからです。

5. 制限を回避するための実践的テクニック

こうしたシステムの物理的な制限（記憶力の限界）を理解していれば、AIが文脈を忘れてしまうことによる手戻りやフラストレーションを未然に防ぐことができます。

① 長大なタスクは分割して依頼する： 限界ギリギリの大量の資料を一度に読み込ませて複雑な処理をさせるのではなく、「まずは第1章を要約して」「次に第2章を要約して」と、AIの作業机が溢れないように小分けにして処理させるのが確実なアプローチです。
② 重要な指示（ルール）は定期的に「再入力」する： チャットでの壁打ちが長く続いてきたと感じたら、AIが古い指示を忘れてしまう前に、「※あなたはプロの編集者です。必ず箇条書きで出力してください」といった**最も重要な前提条件を、最新のプロンプトの末尾にコピー＆ペーストして、もう一度机の上に置いてあげる（リマインドする）**テクニックが非常に有効です。
③ 話題が変わったら「新しいチャット」を立ち上げる： 一つのチャット画面で、企画書の相談からExcel関数の質問、翻訳作業まで、全く別の話題を続けるのはNGです。無関係な過去の会話履歴が無駄にトークンを消費し、机を占領してしまいます。話題やタスクが変わるたびに「新規チャット」ボタンを押し、まっさらな机を用意することが、AIのパフォーマンスを安定させる最大のコツです。

6. まとめ：AIの「限界」を知ることが活用の第一歩

「トークン」と「コンテキストウィンドウ」は、目に見えにくいシステム裏側の仕組みですが、AIを実務のパートナーとして使いこなすためには必須の基礎知識です。

AIは万能の魔法ではなく、明確な処理上限を持ったコンピュータシステムです。「AIは一度に記憶できる量に限界があり、許容量を超えると古い指示から忘れてしまう」という特性を正しく理解し、AIの作業机が溢れないように適切にコントロールすること。このシステムへの歩み寄りこそが、生成AIのポテンシャルを最大限に引き出すプロンプト・エンジニアリングの重要な要素となります。

この記事の監修者