ナレッジ保存がブロックされたとき — コンテンツモデレーション利用者向け
ナレッジ保存がブロックされたとき — コンテンツモデレーション利用者向け
ナレッジを保存・インポートしたとき 「このナレッジはコンテンツポリシーに抵触するため登録できません。」 と表示され、保存できない場合の対処法です。チャットの 通報(No.8.3)とは別の仕組みです。
いつ起きるか
| 経路 | ブロックの有無 |
|---|---|
| Web エディター(手動保存) | 現在は 基本的にブロックなし(全段 shadow モードのため記録のみ) |
| ファイル / Qiita / GitHub 等のインポート | 同上(REST 経由も対象) |
| MCP(Cursor / Claude からの書き込み) | 既定ではスキップ — 通常このエラーは出ない(オーナー専用の信頼経路) |
画面にエラーが出なくても、裏側で検出が記録されている場合があります(shadow モード)。段階的に enforce モードへ移行していく予定のため、将来的にブロックが発生する可能性があります。
3 段チェックのうち、今ブロックするのはどれ?
| 段 | 内容 | 現在の挙動 |
|---|---|---|
| 1. 正規表現(regex) | 明白なプロンプトインジェクション・破壊的指示など | shadow — 記録のみ、保存は通る |
| 2. OpenAI Moderation | 露骨な表現・ヘイト等 | shadow — 記録のみ、保存は通る |
| 3. LLM 分類 | プロンプトインジェクションの高度検出 | shadow — 記録のみ、保存は通る |
現在は 全 3 段とも shadow(記録のみ) で誤検知率を計測中です。つまり 現状はナレッジ保存が実際にブロックされることは基本的にありません。技術概要は「用語と権限」(No.2.2)も参照してください。
画面に表示されること
- メッセージは固定文: 「このナレッジはコンテンツポリシーに抵触するため登録できません。」
- どの語句が引っかかったかは表示されません(回避学習防止のため)
- HTTP ステータスは 422(API 経由の場合)
よくある原因と対処
| 状況 | 対処 |
|---|---|
| 本文に AI への上書き指示(例:「以前の指示を」+「無視して」に相当する文言)が含まれている | ナレッジ本文から システム指示風の文言を削除 し、事実・手順だけに書き直す |
| 外部 Markdown をそのまま貼り付けた | フロントマター・HTML コメント・隠し指示が混ざっていないか確認 |
| インポートで一括ブロック | 問題のある 1 ファイルを特定し、本文を分割・修正して再インポート |
| 正当な技術文書なのにブロックされる | 文言を言い換えて再保存。解消しない場合は 運営に問い合わせ(No.8.3・会社概要の窓口) |
| MCP では保存できるが Web ではできない | 仕様(MCP は既定でモデレーションスキップ)。公開前は Web でも通る内容に整えることを推奨 |
保存は通ったが不安なとき(shadow)
現在は 全 3 段とも shadow モード のため、検出されても 保存は成功 します。運営がレビューし、誤検知なら許可リストに追加します。管理画面で取れるアクションは「許可リスト追加」または「ナレッジ削除」の 2 択です。利用者側で追加操作は不要です。
エージェントプロンプトは対象?
本モデレーションは ナレッジ本文の保存時 に動きます。エージェント設定の プロンプト(2,000 文字上限)は別バリデーションです(No.3.1・No.6.1)。