「富岳」で生成AI基盤完成=日本語能力に特化―東工大・富士通など

科学 技術・デジタル

東京工業大や富士通などは10日、スーパーコンピューター「富岳」を活用し、文章などを自動で作る生成AI(人工知能)の基盤となる大規模言語モデル「Fugaku―LLM」を開発したと発表した。学習データの多くに日本語を用いており、国内のニーズに合わせた生成AIの研究につながることが期待される。

富岳を使った開発は2023年5月から開始され、東北大や名古屋大、理化学研究所なども参加した。学習データの約6割が日本語で、松尾芭蕉の俳句に関する質問にも流ちょうに回答できるなど、日本語能力に特化している点が特徴だ。

こうしたデータは開発に当たって独自に収集したもので、有害な文言をあらかじめ排除するなどした。このため学習の全過程を把握でき、海外のモデルと比べて透明性と安全性が向上したという。

スーパーコンピューター「富岳」を活用して開発された大規模言語モデル「Fugaku―LLM」のデモ画面(富士通提供)スーパーコンピューター「富岳」を活用して開発された大規模言語モデル「Fugaku―LLM」のデモ画面(富士通提供)

[Copyright The Jiji Press, Ltd.]

時事通信ニュース