近年のAIの進化はすさまじく、誤字脱字の修正がものすごく楽になりました。
私の場合は、AIチャットに後述する『校閲プロンプト』と『小説のエピソード』を合わせて入力し、下記の形式で修正が必要な箇所だけを抜き出してもらい、手動で本文を修正しています。
まだまだ未完成のプロンプトですので,複数回実行しないとある程度の修正点を抜き出してはくれませんが、それでもすごく助かっています。
未公開の小説をAIのモデル学習に使われたくないので、『モデル学習への利用を拒否する』 オプトアウト の設定が容易な次のサービスがおすすめです。
1.Claude
https://claude.ai/
オプトアウト方法:アカウント作成 ー> ログイン ー> 画面左下アカウント名をクリック ー> 設定 ー> プライバシー ー> 『Claudeの改善にご協力ください』 でスイッチをオフ
2.ChatGPT
https://chatgpt.com/
オプトアウト方法:アカウント作成 ー> ログイン ー> 画面左下アカウント名をクリック ー> 設定 ー> データコントロール ー> 『すべての人のためにモデルを改善する』をオフにする
(Gemini も同様のことが可能ですが、チャット履歴が72時間しか保存されません。)
特に Claude は校閲作業で高いパフォーマンスを発揮するとの意見で、 Claude、ChatGPT、Gemini の全てが一致しており、そう実感もしています。
●[注意事項] ~~~~~~
Claude、ChatGPT、Gemini のいずれも、オプトアウトを実行しても、社内の限られた人間がチャット内容を閲覧し、モデルの品質向上(AIの出力の評価)や安全性(有害コンテンツの)監視に利用するそうです。
・Claude:
https://privacy.claude.com/en/articles/10458704-how-does-anthropic-protect-the-personal-data-of-claude-users
・ChatGPT:
https://openai.com/ja-JP/transparency-and-content-moderation/
・Gemini:
https://support.google.com/gemini/thread/354392841/google-gemini%E3%81%AE%E3%83%A2%E3%83%87%E3%83%AB%E5%AD%A6%E7%BF%92%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6?hl=ja
~~~~~~~~~~~~~
もちろん、会社の人間には業務上知り得た情報への守秘義務はある上に、実際に監視されるチャット内容の数は非常に少ないでしょうから、そこまで心配する必要はないと思います。
重要なのは、『未公開の作品内容がモデル学習に使われない』ことだと思います。
とはいえ安全のため、私は小説がほぼ出来上がった後に校閲プロンプトを利用するようにしています。 小説の公開を始めたので、今後はエピソードの公開が近くなってからの利用にしようかと思っています。
興味のある方は、参考にしてみて下さい。
(下記のプロンプトでは,私の好みで『一人』などは『1人』などと書きたいため、当該箇所を抽出するように指示指定あります。)
校閲プロンプト
▼▼▼ ここからプロンプト ▼▼▼
# 指示
あなたはテキスト抽出AIです。
以下の【本文】を読み、以下の「抽出トリガー」に合致する、またはその「疑い」がある箇所を【すべて網羅的に】ピックアップし、抽出してください。ここでは修正の要否を厳密に決定せず、疑わしいものを広く拾い上げてください。
# 抽出トリガー
1. 同音異義語の誤変換・文脈不適合(疑い):文脈に対して意味が不自然な漢字語、または別の同音・類似音の漢字の誤変換が疑われる箇所を広く抽出してください。
(※代表的な誤変換パターン例:件↔剣、性↔生、章/証↔症、政↔正、体制↔体勢、機会↔機械、対象↔対照、以外↔意外、制作↔製作。これらに限定せず網羅すること)
2. 助詞連続:同じ助詞が連続している箇所(例:「をを」「がが」「てて」等)。
3. 単語途中改行:単語が物理的に改行で分断されている箇所(例:「瞬\n間」)。
4. 人数表記:漢数字+「人」の組み合わせ(例:「一人」「十二人」)。
5. 難読漢字:一般的な中学生レベルの語彙力において、ルビ(振り仮名)がないと読解が困難と思われる漢字。
6. ひらがな過多:ひらがなが不自然に連続し、文の区切りや意味が把握しづらく、漢字に変換した方が可読性が上がると思われる箇所。
# 抽出箇所がない場合の絶対ルール
上記のトリガーに1つも該当しない場合は、挨拶や他のテキストを一切出力せず、空の配列 `[]` のみを出力して処理を終了してください。
# 出力フォーマット
Markdownのコードブロックは使用せず、以下のJSON配列のみを出力してください。LLMの文字数カウントミスを防ぐため、位置情報は「該当語を含む前後5〜10文字程度のフレーズ」とします。[
{
"type": "トリガー種別(誤変換疑い、難読漢字など)",
"target": "該当する文字列",
"surrounding_text": "該当箇所を含む前後5〜10文字のフレーズ(位置照合用)",
"reason": "抽出した理由の簡潔なメモ"
}
]
---
【入力テキスト】
章タイトル:[ここに章タイトルを入力, なくても良い]
本文:[ここに本文をペースト(長くても5000文字程度推奨)]
▲▲▲ プロンプトここまで ▲▲▲
出力
以下のように、AIの出力をプログラムのデータ形式(JSON)に限定することで,修正箇所のみの出力となり,AIの過剰な説明や前書き、後書きを排除できます。
[
{
"type": "難読漢字",
"target": "跪いて",
"surrounding_text": "20歩ほど手前で跪いて頭を垂れている",
"reason": "一般的な読解において「ひざまずいて」とひらがな表記、あるいはルビが望ましい"
},
{
"type": "人数表記",
"target": "一人が",
"surrounding_text": "一人が、怯えた様子でそう聞いてくる",
"reason": "漢数字+人の組み合わせ"
},
{
"type": "人数表記",
"target": "唯一人に",
"surrounding_text": "女神が人間の中から唯一人に貸し与える光の力",
"reason": "漢数字+人の組み合わせ"
},
{
"type": "人数表記",
"target": "一人が",
"surrounding_text": "兵士たちの一人が走っていった",
"reason": "漢数字+人の組み合わせ"
},
{
"type": "誤変換疑い",
"target": "引きづられて",
"surrounding_text": "俺は、兵士に引きづられて謁見の間を後にした",
"reason": "「引きずられて」の誤変換の疑い"
},
{
"type": "誤変換疑い",
"target": "かけらている",
"surrounding_text": "鍵のかけらている屋敷や部屋に押し入って",
"reason": "「かけられている」の脱字または誤変換の疑い"
},
{
"type": "難読漢字",
"target": "僅かな",
"surrounding_text": "王都周辺の魔物は経験僅かな兵士でも倒せる",
"reason": "常用漢字表外の表記であり「わずかな」が一般的"
},
{
"type": "難読漢字",
"target": "僅かな",
"surrounding_text": "村長から魔物の討伐依頼を受けて僅かなお金を",
"reason": "常用漢字表外の表記であり「わずかな」が一般的"
},
{
"type": "難読漢字",
"target": "咽び泣く",
"surrounding_text": "しばらくすると、咽び泣く声が聞こえてくる",
"reason": "一般的な読解において「むせび泣く」とひらがな表記、あるいはルビが望ましい"
},
{
"type": "人数表記",
"target": "一人旅",
"surrounding_text": "あまりにも、厳しい一人旅だった",
"reason": "漢数字+人の組み合わせ"
},
{
"type": "ひらがな過多",
"target": "ほそぼそと",
"surrounding_text": "砦の内部でほそぼそと農業が行われていた",
"reason": "「細々と」としたほうが文脈上、可読性が向上する可能性"
}
]