自動運転開発を加速する日本国内
実走行データを中核とした高品質
オープンデータセットのご提供
本事業の概要
本事業は、地域が抱える移動課題の解決に向け、自動運転技術の社会実装を加速することを目的としています。特に、研究・先行開発段階においてボトルネックとなりがちな高品質なデータへのアクセス不足を解消するため、産業界で幅広く活用可能なデータ基盤の整備が求められてきました。当社はこの取り組みの中で、商用開発でも実利用可能な品質水準を意識したデータセットを設計・構築しています。
データセットについて(最終更新: 2026年2月)
今回公開するデータセットは、計測車両から得られた「実走行データ」と、エッジケース拡充のために生成AIで構築した「仮想データ」の2種に大別されます。実走行データは、日本全国の広範な環境を網羅する「データセット1」と、自動運転サービスの実装を想定し特定領域を高密度にカバーする「データセット2」から成り、各々の目的に応じたセンサー構成を備えています。
また、実環境では収集が困難な事象を補完するため、生成AIによる仮想データ「データセット3」を用意しました。これには、画像内に仮想オブジェクト配置による動画生成を用いた「3-1」と、既存の実走行データに対し時間帯や天候の条件を変換した「3-2」の2つのアプローチが含まれます。
乗用車に搭載したセンサーで取得した、広範囲・大規模データ
100時間分(1クリップあたり30秒)
-
センサーデータ
-
カメラ8台 20Hz
-
LiDAR 4台 10Hz
-
走行場所
-
日本全国
アノテーションデータ
-
2Dパノプティックセグメンテーション
-
2D 信号認識
-
3D バウンディングボックス
ロボットタクシー車両で取得した特定ドメイン適合用データ
約1時間分(1クリップあたり60秒)
走行場所
-
東京都お台場周辺
アノテーションデータ
-
2Dパノプティックセグメンテーション
-
2D 信号認識
-
3D バウンディングボックス
エッジケース補完のための仮想合成データ
約1時間分
アノテーションデータ
-
2Dパノプティックセグメンテーション
約1時間分
アノテーションデータ
-
2Dパノプティックセグメンテーション
利用申し込みについて
本データセットのサンプルデータ(各データセット1シーン)を、Google Driveにて公開しております。 全データセット(約100時間相当)のご利用を希望される場合は、利用規約への同意と、申込書によるお手続きが必要となります。以下のリンクより利用申込書をダウンロードいただき、必要事項をご記入の上、下記メールアドレスまでお送りください。
お問い合わせ・利用申込書の送付先: dataset-2025@tier4.jp
- TOP
- データセット