以下の内容はhttps://kiyo-shit.hatenablog.com/entry/2025/03/05/085841より取得しました。


音声入力の結果を俺らしくする

  • 音声入力と文章表現の差異について考えている
    • 現代でも口語と文語には若干の差がある
      • 文語では言い切り型や箇条書きなど、独自の表現方法がある
      • 一方、考え方そのものには口頭でも文章でも大きな違いはない
  • 音声入力した内容を論理構造を整えて出力するのは有効
    • 最近自分で試して、これは知見として得られた
    • 音声入力した文章を、自分が過去に書いてきた文体に合わせることで、話した内容が自分の文章そのものになるという体験をしている
      • シンプルに過去の社内ブログ投稿をサンプルとして、指示を与えることで文体が揃っている
      • 出力の品質も高く満足している
  • 最近もてはやされる推論モデルについての知見
    • 推論モデル(例:o1 pro modeやo3-mini-high)は意外と自己流の味付けが強い
    • サンプル文体を忠実に模倣させる指示を出しても、ザコシのものまねくらい誇張されてしまう
    • 今は非推論型のGPT-4.5を使っている
      • GPT-4.5は文体の再現性がちょうど良い感じ
      • ハイブリッド型であるClaude 3.7 Sonnetよりも自分の文体に近い出力をするが、多少の試行錯誤(ガチャ)は必要
      • 再現性のレベルで言うとキンタロー。のものまね程度には到達している
  • 社内ブログは箇条書き形式で書いている
    • このブログではあまり使わなかった形式なので若干違和感がある
      • 文体や文章構成は時代とともに変化する
      • 2015年や2035年の文章データを食わせればまた違う結果が出てくるはず
    • とりあえずやってみているというお披露目を兼ねてここに置いておく

って感じで、これはガチャ2回で軽い修正のみ。めちゃくちゃ便利になってしまった。




以上の内容はhttps://kiyo-shit.hatenablog.com/entry/2025/03/05/085841より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14