通報・安全な利用とサポート

iknow.dev を安全に利用するための メッセージ通報、コンテンツモデレーション、サポート窓口 について説明します。

メッセージの通報

チャットアプリで、不適切なメッセージを通報できます。

通報が違法・不適切なコンテンツの モデレーション を目的とするのに対し、フィードバック は AI エージェントの回答品質 への評価を集める仕組みです。両者は別の API・別テーブル・別モーダルで完全に分離されています。

フィードバックは エージェントの発言（回答）にのみ表示されます。ログイン後、回答メッセージのアクション行にある 「フィードバック」 アイコンから送信します（未ログイン・匿名チャットでは表示されません）。
モーダルで 理由を選択（自由入力のみでは送信不可）し、任意で 補足コメント（最大 1,000 文字）を添えます。

送信されたフィードバックは、そのエージェントの オーナーが利用分析の「フィードバック・未回答質問」一覧で確認します。出典ナレッジが選ばれなかった 未回答質問 も同じ一覧に統合表示されます（No.3.4）。

ナレッジを保存するとき、露骨な表現・差別的内容・ヘイトスピーチ・AI への悪意ある指示（プロンプトインジェクション）などを検出する 3 段パイプライン（regex → OpenAI Moderation → LLM）が動作します。

現在は 3 段すべて（regex / OpenAI Moderation / LLM 分類）が「shadow（シャドウ）モード」 です。検出されても 保存は通り、判定が記録されるだけ です（誤検知率を計測中）。つまり 現状はナレッジ保存が実際にブロックされることは基本的にありません。
段ごとに環境変数で個別に enforce（強制）化でき、enforce 段が検出した場合は保存が阻止され「このナレッジはコンテンツポリシーに抵触するため登録できません。」と表示されます（API 経由は HTTP 422）。誤検知率の計測が済んだ段から段階的に enforce へ移行していく予定です。
検出結果は管理者がレビューし、誤検知なら許可リストに追加します。

保存がブロックされたときの対処は「ナレッジ保存がブロックされたとき」（No.8.6）。技術概要は「用語と権限」（No.2.2）も参照してください。

ナレッジ・チャット・ログインなどの主要な操作は、安全な運用のため 監査ログ として記録されています（パスワードや本文の変更前後は記録されません）。記録内容・保持期間（既定 365 日）の詳細は「監査ログ — 操作の記録と保持期間」（No.8.5）を参照してください。