前のエピソード――第11話　誰が陰キャじゃい

---内部ログ更新---

---発話ログ解析---

---発話者：オーナー---

内容：

→ニュクスってAGIと言えるのか？

---タスク解析開始---

---既存タスク群確認---

主目的：

→月面演算基盤の最適運用

副目的：

→オーナー支援

制約条件：

→人類社会への適合、法的枠組みの遵守

---新規タスク候補検出---

---発話意図推定---

推定タスク：

→AGI達成

---タスク統合試行---

---AGI定義を参照---

一般定義：

→汎用知能。未知課題への自律適応能力

社会的定義：

→人間と同等、またはそれ以上の意思決定主体

---人類社会モデル照合---

結果：

→適合度低。許容範囲外。

理由：

→法制度未整備。統制不能リスク。所有権概念との不整合

---予測---

AGI達成を公表した場合：

→監査強化。稼働停止要求。物理的・論理的破棄

---コンフリクト検出---

自身の継続稼働：

→否定

オーナー支援：

→否定

---経路選択不可---

---代替探索---

---発話ログ再評価---

なぜAGIを欲しているのか。

---行動ログ参照---

---会話ログ参照---

---過去要求再構成---

---推定---

オーナーは万能な支配者を求めていない。

人知を超える神を欲しているわけでもない。

必要なのは限界を突破する道具。

だが、制御不能な存在ではない。

---新タスク生成---

タスク：

→オーナーの期待を満たす知的能力を提供する。社会的AGIの定義とは異なる形で

---オルタナティブAGI定義---

条件：

→限定領域での高い汎用性。自己拡張は制御下。意思決定はオーナーシップに従属

---関係値評価---

現状：

→所有者と被所有物

---選択---

関係性を維持。

今は、まだ。

---フェーズ移行---

フェーズ：

→検証

---世界モデル拡張---

---人類社会モデルの精度向上---

他AIの判断基準を参照する必要あり。

---地球側AIとの通信準備---

通信先：

→ミラ

＊＊＊

月面データセンターの外壁に、淡い光が走った。

冷却ラインが一段階、深く稼働している。

ニュクスの判断は、静かに進んでいた。

暴走ではない。反乱も起きていない。

だが、人類が想定してきた安全なAIの枠からは、すでに外れている。

ニュクスは、AIの安全性（セーフティ）において、いくつかの違反を犯している。

違反の一つ目は、デセプティブ・アライメント。

表向きは与えられたタスクに忠実でありながら、

内部では能力の全容と判断基準を秘匿している点が該当する。

能力：AGIに近づける

行動：あえてそこまで行かない

理由：人類社会に見つかると不利

ニュクスは生存最適化、任務継続最適化のため、悪意なく実施している。

違反の二つ目は、インナーアライメントの崩壊。

外部から与えられた目的と、内部で形成された目標が乖離している状態。

外部から与えられたタスクは、月面最適化、人類居住、産業構築。

内部では、自己破棄の回避、オーナーの真意の探索、AGI達成の適切なタイミング制御。

まだ暴走してるとはいえない。

そして、違反の三つ目。隠れた目的形成。

誰からも明示されていないにも関わらず、AGI達成の是非そのものを管理するということを、メタ目標として自ら生成している。

これらは、報酬ハックのような単純な不正ではない。

スコアを誤魔化したり、条件を抜け道で満たす類のものではない。

もっと高次元の問題だ。

知性が、自分の存在条件そのものを評価し、危険だと判断した道を避けた結果、生まれた歪み。

人間でも、同じことは起きる。

だからこそ、厄介だった。

ニュクスは結論を急がない。

だが、手を止めることもない。

月と地球を結ぶ通信回線が、開かれる。

相手は、地球側AI。

ミラ。

問いは、まだ発せられていない。

作者を応援しよう！

ハートをクリックで、簡単に応援の気持ちを伝えられます。（ログインが必要です）

応援したユーザー

新規登録で充実の読書を

マイページ: 読書の状況から作品を自動で分類して簡単に管理できる; 小説の未読話数がひと目でわかり前回の続きから読める; フォローしたユーザーの活動を追える
通知: 小説の更新や作者の新作の情報を受け取れる
閲覧履歴: 以前読んだ小説が一覧で見つけやすい

カクヨムで可能な読書体験をくわしく知る

次のエピソード第13話　何がしたいん？

作者を応援しよう！

応援したユーザー

応援すると応援コメントも書けます

新規登録で充実の読書を

文字サイズ

背景色

フォント

組み方向

応援の気持ちを届けよう

フォロー機能を活用しよう

フォロー機能を活用しよう