通報・安全な利用とサポート
通報・安全な利用とサポート
iknow.dev を安全に利用するための メッセージ通報、コンテンツモデレーション、サポート窓口 について説明します。
メッセージの通報
チャットアプリで、不適切なメッセージを通報できます。
通報できるメッセージ
| 対象 | 通報 |
|---|---|
| 他人のユーザー発言 | できる(ログイン必要) |
| エージェントの発言 | できる(ログイン必要) |
| 自分の発言 | 通報ではなく編集・削除を使用 |
| 未ログイン閲覧中 | 通報不可(コピーのみ) |
通報の手順
- チャットアプリで対象メッセージにマウスを乗せます。
- 「通報」 アイコンをクリックします。
- モーダルで 理由を選択 します(自由入力のみでは送信できません)。
- 必要に応じて 補足コメント(最大 1,000 文字)を添えて送信します。
通報理由の種類
| 理由コード | 内容 |
|---|---|
illegal |
違法行為・違法コンテンツ |
harassment |
嫌がらせ・ハラスメント |
spam |
スパム |
other |
その他 |
回答へのフィードバック
通報 が違法・不適切なコンテンツの モデレーション を目的とするのに対し、フィードバック は AI エージェントの回答品質 への評価を集める仕組みです。両者は別の API・別テーブル・別モーダルで完全に分離されています。
- フィードバックは エージェントの発言(回答)にのみ表示されます。ログイン後、回答メッセージのアクション行にある 「フィードバック」 アイコンから送信します(未ログイン・匿名チャットでは表示されません)。
- モーダルで 理由を選択(自由入力のみでは送信不可)し、任意で 補足コメント(最大 1,000 文字)を添えます。
| 理由コード | 内容 |
|---|---|
factual_error |
事実誤り |
insufficient_info |
情報が不足している |
irrelevant |
質問と関係がない |
- 送信されたフィードバックは、そのエージェントの オーナーが利用分析の「フィードバック・未回答質問」一覧で確認します。出典ナレッジが選ばれなかった 未回答質問 も同じ一覧に統合表示されます(No.3.4)。
ナレッジのコンテンツモデレーション
ナレッジを保存するとき、露骨な表現・差別的内容・ヘイトスピーチ・AI への悪意ある指示(プロンプトインジェクション)などを検出する 3 段パイプライン(regex → OpenAI Moderation → LLM)が動作します。
現在の運用(段階別モード)
- 現在は 3 段すべて(regex / OpenAI Moderation / LLM 分類)が「shadow(シャドウ)モード」 です。検出されても 保存は通り、判定が記録されるだけ です(誤検知率を計測中)。つまり 現状はナレッジ保存が実際にブロックされることは基本的にありません。
- 段ごとに環境変数で個別に enforce(強制)化でき、enforce 段が検出した場合は保存が阻止され「このナレッジはコンテンツポリシーに抵触するため登録できません。」と表示されます(API 経由は HTTP 422)。誤検知率の計測が済んだ段から段階的に enforce へ移行していく予定です。
- 検出結果は管理者がレビューし、誤検知なら許可リストに追加します。
MCP 経由の書き込み
- Cursor / Claude からの MCP 書き込み(オーナー専用)は、信頼された経路として 既定でモデレーションをスキップ します。
保存がブロックされたときの対処は「ナレッジ保存がブロックされたとき」(No.8.6)。技術概要は「用語と権限」(No.2.2)も参照してください。
安全に利用するためのヒント
- パブリックチャットは共有空間 — 他ユーザーからも閲覧可能です。個人情報・機密情報は送らないでください。
- 匿名チャットも同様 — iknow Navigator への匿名送信も、同じチャットルームを開いた人からは見えます。
- プライベートエージェント — オーナーとメンバーのみアクセスできます。社内・限定共有向けです。
- ナレッジ添付ファイル — プライベートエージェントの添付は認可チェック付きで配信され、URL を知っているだけでは閲覧できません。
操作の記録(監査ログ)
ナレッジ・チャット・ログインなどの主要な操作は、安全な運用のため 監査ログ として記録されています(パスワードや本文の変更前後は記録されません)。記録内容・保持期間(既定 365 日)の詳細は「監査ログ — 操作の記録と保持期間」(No.8.5)を参照してください。