Keio Shonan Fujisawa Corpus
(Keio SFC)
テストページ
Keio SFC(の試作品)のページへようこそ!
このコーパスは「理論言語学研究に適したテキスト・アーカイブ」を作成するというプロジェクトの一環で構築されている(進行中)コーパスです。多様な言語背景を持つ方を対象に、簡単なVR動画を視聴してもらい、内容を音声と作文で描写してもらい、そこで産出された言葉をコーパス化しています。
公開・運用に先立ち、どのようなインターフェイスで検索が可能となるのかという点についてのイメージを膨らませていただくために、ここでは、2025年度春学期のセミナー(研究会)「言語×DH×FW」に参加してくれた学生さんが書いた絵描写課題をコーパス化し、それについて検索ができるプラットフォームを提供しています。実際に使われた絵描写課題は、課題番号91の「鍵」、そして、課題番号92の「ピクニック」です(下記の参考文献で用いられている絵描写課題を実施いたしました)。これは、国立国語研究所からレリースされているI-JASや神戸大学の石川慎一郎先生が構築されているJASWRICと同じ課題になっています。
今後公開予定のKeio SFCでは、別の動画描写課題を実施する予定ですが、ここでは、公開される予定のコーパスの青写真を提供する目的で、セミナーで行われたデータをデモとして用いています。また、最終的にKeio SFCでは、多言語での結果が得られるようなパラレルコーパスの作成を目指していますが、現時点では、日本語の検索結果しか返ってこない点も、どうかご了承ください。
このページは、現在応募中の科研費の審査者、および、2025年度夏季特別プロジェクト「自然言語処理と理論言語学」および、2025年度秋学期のセミナーに参加する学生にのみ限定して公開されています。他の人へのリンクの共有はご遠慮ください。
追記(2025年10月1日):現在、下記の動画を用いた暫定的なコーパスの構築を始めました。

