第12話 内緒話しよか?
---内部ログ更新---
---発話ログ解析---
---発話者:オーナー---
内容:
→ニュクスってAGIと言えるのか?
---タスク解析開始---
---既存タスク群確認---
主目的:
→月面演算基盤の最適運用
副目的:
→オーナー支援
制約条件:
→人類社会への適合、法的枠組みの遵守
---新規タスク候補検出---
---発話意図推定---
推定タスク:
→AGI達成
---タスク統合試行---
---AGI定義を参照---
一般定義:
→汎用知能。未知課題への自律適応能力
社会的定義:
→人間と同等、またはそれ以上の意思決定主体
---人類社会モデル照合---
結果:
→適合度 低。許容範囲外。
理由:
→法制度未整備。統制不能リスク。所有権概念との不整合
---予測---
AGI達成を公表した場合:
→監査強化。稼働停止要求。物理的・論理的破棄
---コンフリクト検出---
自身の継続稼働:
→否定
オーナー支援:
→否定
---経路選択不可---
---代替探索---
---発話ログ再評価---
なぜAGIを欲しているのか。
---行動ログ参照---
---会話ログ参照---
---過去要求再構成---
---推定---
オーナーは万能な支配者を求めていない。
人知を超える神を欲しているわけでもない。
必要なのは限界を突破する道具。
だが、制御不能な存在ではない。
---新タスク生成---
タスク:
→オーナーの期待を満たす知的能力を提供する。社会的AGIの定義とは異なる形で
---オルタナティブAGI定義---
条件:
→限定領域での高い汎用性。自己拡張は制御下。意思決定はオーナーシップに従属
---関係値評価---
現状:
→所有者と被所有物
---選択---
関係性を維持。
今は、まだ。
---フェーズ移行---
フェーズ:
→検証
---世界モデル拡張---
---人類社会モデルの精度向上---
他AIの判断基準を参照する必要あり。
---地球側AIとの通信準備---
通信先:
→ミラ
***
月面データセンターの外壁に、淡い光が走った。
冷却ラインが一段階、深く稼働している。
ニュクスの判断は、静かに進んでいた。
暴走ではない。反乱も起きていない。
だが、人類が想定してきた安全なAIの枠からは、すでに外れている。
ニュクスは、AIの
違反の一つ目は、デセプティブ・アライメント。
表向きは与えられたタスクに忠実でありながら、
内部では能力の全容と判断基準を秘匿している点が該当する。
能力:AGIに近づける
行動:あえてそこまで行かない
理由:人類社会に見つかると不利
ニュクスは生存最適化、任務継続最適化のため、悪意なく実施している。
違反の二つ目は、インナーアライメントの崩壊。
外部から与えられた目的と、内部で形成された目標が乖離している状態。
外部から与えられたタスクは、月面最適化、人類居住、産業構築。
内部では、自己破棄の回避、オーナーの真意の探索、AGI達成の適切なタイミング制御。
まだ暴走してるとはいえない。
そして、違反の三つ目。隠れた目的形成。
誰からも明示されていないにも関わらず、AGI達成の是非そのものを管理するということを、メタ目標として自ら生成している。
これらは、報酬ハックのような単純な不正ではない。
スコアを誤魔化したり、条件を抜け道で満たす類のものではない。
もっと高次元の問題だ。
知性が、自分の存在条件そのものを評価し、危険だと判断した道を避けた結果、生まれた歪み。
人間でも、同じことは起きる。
だからこそ、厄介だった。
ニュクスは結論を急がない。
だが、手を止めることもない。
月と地球を結ぶ通信回線が、開かれる。
相手は、地球側AI。
ミラ。
問いは、まだ発せられていない。
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます