rinna、日本語に特化した強化学習済み対話型GPT言語モデルをオープンソースで公開

rinna（⁠株⁠）は2023年5月31日、ChatGPTの学習に利用されているGPT言語モデルの人間の評価を利用した強化学習に成功したことを発表した。あわせて、強化学習済みの日本語に特化した対話GPT言語モデルをオープンソースで公開した。

ChatGPTの学習にも用いられている、人間の評価を利用した強化学習を行った日本語に特化したGPT言語モデルを公開しました。
詳しくはこちらをご覧ください。https://t.co/tCAO4J061i
— rinna Research (@rinna_research) May 31, 2023

GPT（Generative Pre-trained Transformer）は、OpenAIにより開発された大規模言語モデルで、ChatGPTの学習にも利用されている。多くの研究機関や企業が事前学習した大規模言語モデルをオープンソースで公開しているが、オープンソースの大規模言語モデルは英語に特化していることが多く、日本語言語モデルの選択肢や性能は十分ではなかった。

rinnaは2023年5月17日に、日本語に特化した36億パラメータを持つ汎用言語モデルと対話言語モデルの2種類のGPT言語モデルをオープンソースで公開した。このとき公開した言語モデルはChatGPTの学習パートの一部にあたる対話形式でユーザーの指示を遂行できるようなfine-tuningのみで、人間の評価を利用した強化学習を実現していなかった。今回公開したのは、ChatGPTに用いられている学習手法でもある、人間の評価を利用した強化学習を施した対話型GPT言語モデル。

同社の調査で、強化学習済みと強化学習前の対話GPT言語モデルの性能を、人間による評価とChatGPTによる自動評価で比較したところ、以下のような結果になったという。

人間による評価: 強化学習済みの返答が良い：47％、差がない：31％、悪い：22％
ChatGPTによる自動評価: 強化学習済みの返答が良い：63％、差がない：3％、悪い：34％

強化学習済み対話GPT言語モデルは商用利用可能なMIT Licenseのもと、Hugging Faceで公開されている。