山田 育矢, Ph.D.

ソフトウェアエンジニア・起業家
株式会社Studio Ousia チーフサイエンティスト
理化学研究所革新知能統合研究センター 客員研究員(知識獲得チーム言語情報アクセス技術チーム
ikuya (atmark) ikuya.net
X (Twitter) GitHub Google Scholar
English version is available here

Studio Ousiaで実用的な自然言語処理の問題に取り組んでいます。 人の役に立つ新しいソフトウェアを継続的に生み出し続けることを目標にして活動しています。
2000年に創業したスタートアップを2005年に売却し、2007年にStudio Ousiaを共同創業しました。開発したソフトウェアは、国際コンペティションでの5回の優勝を含む多数の受賞歴があります。国際会議NIPS 2017では、開発したAIが全米クイズ王6人のチームに勝利しました。LUKEWikipedia2Vecをはじめとする多数の言語のAIモデルを開発。書籍「大規模言語モデル入門」を監修・共著、「ディープラーニングによる自然言語処理」を共著で執筆。未踏OB(未踏ユース2002、未踏2003)。博士(学術)。Kaggle Competitions Master

大学入学時にインターネットの研究開発を行うベンチャー企業ニューロンを起業。情報処理推進機構(IPA)が実施した未踏ソフトウェア創造事業、次世代ソフトウェア開発事業を通じて、Peer to Peer通信におけるNATトラバーサルを実現する技術を開発(掲載記事: Internet Watch, 日経XTECH)。その後、同社をフラクタリスト社に売却。

2007年に自然言語処理の研究開発を行うStudio Ousiaを共同創業。自然言語処理の基本的な問題である質問応答及びエンティティ抽出についての研究開発を推進。

開発した質問応答技術は、国際会議NIPS(現NeurIPS)2017で開催されたコンペティションにおいて世界最高性能を獲得。開発したシステムと人間の全米クイズ王で構成される6人のチームとの対戦が行われ、465対200のスコアで勝利した(掲載記事: ITmedia, 読売新聞, TechCrunch, AI NOW, CodeZine)。NeurIPS 2020で開催されたコンペティションでは、6GB制約トラックにおいてFacebook AIに次いで準優勝、無制約トラックにおいてMicrosoft、Facebook AIに次いで3位と世界最高峰の研究機関と比する性能を獲得した。

開発したエンティティ抽出技術はトップ国際会議WWW 2015、ACL 2015で行われた2つの国際コンペティションにおいて連続して世界最高性能を獲得(掲載記事: BRIDGE, Techwave, TechCrunch)。2018年に公開したWikipedia2Vec投資ファンドBlackRock社のエンティティリンキングシステム金融情報サービス企業Bloomberg社のトレンド検出システム等、多数の企業や研究機関が標準的に利用するツールになった。2020年に発表したLUKEは5つの著名な自然言語処理のベンチマークにおいて世界最高性能を獲得。世界標準の自然言語処理ツールであるTransformersモデルの1つとして追加され、幅広いユーザに利用されはじめている(掲載記事: Ledge.ai, AI-SCHOLAR)。

中学から大学院博士課程まで慶應義塾大学SFCキャンパスで学ぶ。2016年に博士(学術)を取得。

What's New

著作

最新の出版物のリストはGoogle Scholarで公開されています。

書籍

ジャーナル論文

主な国際会議論文

受賞

講演

オープンソース・ソフトウェア

学術活動