サイバーエージェント、独自の日本語LLM(大規模言語モデル)を開発 自然な日本語の文章生成を実現

  • X
  • Facebook
  • note
  • hatena
  • Pocket
2023/05/12 07:00

 サイバーエージェントは、独自の日本語LLM(Large Language Model、大規模言語モデル)を開発したことを発表。

 本モデルはすでに130億パラメータまでの開発が完了しており、同社が提供する「極予測AI」「極予測TD」「極予測LP」などAIを活用した広告クリエイティブ制作領域のサービスにおいて活用を始めている。

 近年、OpenAI社が開発した「ChatGPT」をはじめとする生成AI・LLMが世界的に注目を集めており、あらゆる業界において急速に活用が進んでいる。一方、既存のLLMのほとんどは英語を中心に学習されており、現状では日本語および日本文化に強いLLMは少ない状況。

独自の日本語LLM(大規模言語モデル)について

 このような背景のもと、今回同社では日本語に特化した独自の大規模モデルを開発した。同社が保有する大規模な日本語データを活かした独自モデルを開発したことで、従来よりも自然な日本語の文章生成が可能となる。

 同社は、「NVIDIA DGX H100」を活用し国内最大級のLLM開発を予定しているなど、より性能の高いモデルの開発を見据えている。

 本モデルは広告配信やクリエイティブ制作における技術課題の解決に取り組む同社のAI研究開発組織「AI Lab」とプロダクト開発チームがともに研究開発しており、今後、産学連携などの取り組みを通し国内における自然言語処理技術の発展に貢献していく予定。

 また同社がこれまでAI技術の社会実装を行う中で培った知見を活かし、広告制作のみならずチャットボットやRPAをはじめとする業界特化型のLLMの構築や、各企業と連携したLLMを活用したビジネス開発の推進なども予定している。

 同社は今後も、高度な技術力を生かし、LLMによる新たな価値提供を行うとともに、各種サービスやプロダクトの品質向上を目指し研究・開発に努めていく。