世界トップクラスの
人工知能データサービス
プロバイダー

データリソース、技術力と豊富なデータ処理経験に基づき、2011年創業以来、
全世界1,000社以上の人工知能企業や研究機関にハイクオリティなデータサービスを提供。

News

  • 2020/05/15

    【人工知能学習データサービス情報】
    Datatangは, 『90,023枚車両画像及びアノテーションデータ』を提供します。
    車両の全体、ボディフロント又はボディ後方、ナンバープレート、 ブランド、モデル、車両の色、ナンバープレートの色、カーナンバーの転写、採集時間等のアノテーション済データです。車両の属性分析をするAIに活用されております。

  • 2020/05/15

    【人工知能学習データサービス情報】
    Datatangは、顔識別用人工知能学習データとして『23,349人多人種顔多姿勢データ』を提供します。
    データ量:23,349人(1人あたり29枚)、多姿勢、多人種、多年齢、複数照明条件、複数採集環境下の収集データです。
    黒人7,413人、白人3,871人、褐色人種 924人、インド人6,365人、黄色人種4,776人(すべて本人承諾済みのデータです)

  • 2020/04/02

    【人工知能 声紋認証学習用データ情報】
    Datatangは、声紋認証人工知能学習用データとして「500人中国語標準語声紋識別音声データ」を提供します。
    数字、Waking-Up words、日常生活、インタラクティブ関連用語が含まれる中国語標準語声紋認証用音声データです。
    時期により、同じ人でも声が異なる場合があるため、本データは1人当たり、2~3週間の間を置いて、3ヶ月かけて、計4回録音を実施しました。

  • 2020/04/01

    【人工知能 TTS音声合成学習用データ情報】
    Datatangは、TTS(Text to Speech)音声合成人工知能学習用データとして「20,000文TTSアメリカ人女性英語音声データ」を提供します。
    専用スタジオでプロ級マイク設備で収録したアメリカ人女性が話すネイティブな英語の音声データです。
    アノテーション内容は発音校正、音素転写、音素境界切り分け、韻律アノテーション、アクセントアノテーション、品詞アノテーション、発音辞書作成を行ったものです。

  • 2020/03/30

    【人工知能学習データサービス情報】
    Datatangは、顔識別用人工知能学習データとして『2,000人顔のマスク着用の多角度写真』を提供します。
    マスク着用状態を判別できるAIの開発用に、2,000人がマスクをしている写真を多角度から、撮影・収集したデータです。

  • 2020/03/28

    Datatangは、一般社団法人 情報サービス産業協会(JISA)に加盟しました。

  • 2020/03/27

    Datatangは、佐賀県産業スマート化センターのサポーティングカンパニーに登録されました。
    佐賀県産業スマート化センターはテクノロジーをキーワードにしたオープンイノベーションの「ハブ」として、県内企業に対するAIやIoTといった先進技術の導入支援や県内IT産業の成長支援を行い、企業の生産性向上や新たなビジネスの創出につなげていきます!

  • 2020/03/12

    DatatangはNPO法人ITジュニア育成交流協会に協賛しました。
    特定非営利活動法人(NPO)ITジュニア育成交流協会は、ITエンジニアを目指す児童・青少年が意欲をもって目標に向かって元気に活動できるよう、関連する専門家や各種教育機関、IT関連企業、研究機関と連携しながら、彼らに夢と希望を与える各種の支援活動を行っています。

  • 2020/02/20

    Datatang Inc.は日本市場において、AIデータサービスビジネスを開始しました。

  • 2020/02/05

    2020年2月5日~6日 Datatang(Beijing)TechnologyはResortTech Okinawa(おきなわ国際IT見本市)に出展しました。

  • 2020/01/27

    週間BCN VOL1810号に掲載されました。

  • 2019/12/08

    Datatang(Beijing)Technologyは『BCN Conference 2019 冬』において、基調講演を実施しました。

  • 2019/11/12

    2019年11月12日~14日 Datatang(Beijing)Technologyは『Gartner IT Symposium/Xpo』に出展しました。

ソリューション

下記掲載のデータは各分野ごとの代表的な事例です。
その他様々な利用シーンに応じたデータ提供が可能ですので、個別にお問い合わせください。

スマートドライブ

お客様のニーズに応じて、大量のスマートドライブのローデータを収集、アノテーションの処理を行い、自動運転業界に最も利用される以下の分野に適用した学習データを提供します。

車載音声

ウィンドウの開閉、音楽プレーヤー、ナビゲーションなどの車載デバイス操作を音声指示によりコントロールし、安全運転の実現をサポートします。

  • 245時間 – 車内の中国語音声データ
  • 3 – Module Message Single-sentence Annotation Data
  • 531時間 – 車内騒音データ
  • 13,000,000 Groups – Man-Machine Conversation Interactive Text Data
  • 20,000 Sentences – TTS Female American Speaking English Speech Data
  • 13 Modules – Entity Name Single-sentence Annotation Data

自動運転

ストリートビュー、車両交通等々のデータ提供と加工サービスにより、高度な自動運転の実現をサポートします。

  • 144ビデオ – 10,973ストリートビューアノテーション画像
  • 1.2万枚 – 車両トラッキング画像アノテーション
  • 53万枚 – ストリートビュー画像バウディンボックスアノテーション
  • 978枚 – ストリートビュー画像多カテゴリーセグメンテーション
  • 144本 – ストリートビュー動画(26時間)
  • 9,876枚 – ストリートビュー画像28種類セグメンテーション

オートパーキング

車体画像と周囲の環境、現在位置、目的地等の情報を取得し、最適なパーキング場に誘導の実現をサポートします。

安全運転

運転行動を監視、分析及び判断することにより、疲労運転、危険運転などの防止の実現をサポートします。

  • 1,003人 – 運転者行動データ
  • 103,282枚 – 運転者行動アノテーションデータ

モバイルアプリ

モバイルアプリケーションのデータには、人間の顔、手、ボディ、シーン識別などが含まれます。モバイルアプリを利用して、顔認証、顔ペイメント、自動メークアップ、自動撮影など様々なシーンに利用されます。

音声会話

音声をテキストに変換し、ボイスチャット、入力、検索、注文、Q&Aなど、様々なシーンに利用されます。

  • 1,175時間 – 中国語標準中国語朗読データ
  • 3,125時間 – 中国語標準中国語音声データ
  • 156人 – マレー語音声データ
  • 200人 – 中国語Waking-UP Words音声データ
  • 203人 – 騒音環境下での中国語音声データ
  • 831時間 – イギリス英語音声データ

フェースID

顔の特徴キーポイント、頬、眉、目、口、鼻の輪郭をアノテーションし、顔認証システムを支援します。
ストラクチャード・ライトシステムは、3D構造化光イメージングの原理に基づいて、顔の表面で反射した光によって深度画像が構築され、対象物が生体であるかどうかを判断します。

  • 1,078人 – 3Dフェイスデータ
  • 62,320人 – フェイス画像の106キーポイントアノテーション(通常のシーン)
  • 50,343人 – フェイス画像の106キーポイントアノテーション(複雑なシーン)
  • 1,066 人 – フェイス不正防止データ
  • 500組 – 双子フェイス画像データ
  • 2,475人 – 12,602枚年代別フェイス画像データ

スマートカメラ

顔の特徴と輪郭の自動認識により、美顔美形に変身できます。同時に、表情、感情、その他の情報を取得して、特殊効果カメラなどでインタラクティブなエンターテイメントAPPが楽しめます。

  • 50,155人 – フェイス画像のレタッチデータ
  • 43,408人 – ボディ画像レタッチとランドマークデータ
  • 62,320人 – フェイス画像の106キーポイントアノテーション(通常のシーン)
  • 50,343人 – フェイス画像の106キーポイントアノテーション(複雑なシーン)
  • 20,000人 – 7つの表情識別データ
  • 50,023人 – ボディ及び衣装セグメンテーションデータ

ジェスチャー制御

拳、OK、指のハート、お辞儀、お別れ、祈り、愛情、賞賛、数字など24種類の一般的なジェスチャーを認識できます。

  • 314,178枚 – 18種類ジェスチャー識別データ
  • 1,000人 – 50種類コントロールジェスチャー識別
  • 183,997人 – 手話ジェスチャーランドマークデータ

スマートホーム

スマートホーム業界で最も人気のある製品は、主にスマートスピーカー、スマート家電、子供向けのストーリーマシン、コンパニオンロボットにフォーカスされます。これらを実現させるアノテーションデータを提供します。

音声会話

スマートホームシステムとインタラクティブな会話することで、よりスマートライフの実現。

  • 101時間 – ノイズデータ
  • 156人 – マレー語音声データ
  • 203人 – 騒音環境下での中国語音声データ
  • 831時間 – イギリス英語音声データ
  • 535時間 – ドイツ人が話す英語音声データ
  • 520時間 – フランス人が話す英語音声データ

異常監視

家庭、病院、養護施設、幼稚園などをリアルタイム監視することで、高齢者の転倒、患者の転倒、子供の転倒などの危険状況をタイムリーに検出し、安全を確保することをサポートします。

  • 120シーン – 火災ビデオデータ
  • 201人 – 幼児の泣き声データ

ジェスチャー制御

インテリジェントテレビ、インテリジェントエアコン、インテリジェントサウンドボックスのジェスチャー制御の実現をサポートします。

  • 314,178枚 – 18種類ジェスチャー識別データ
  • 1,000人 – 50種類コントロールジェスチャー識別
  • 183,997人 – 手話ジェスチャーランドマークデータ

カスタマーサービス

カスタマーサービスの音声データは、金融、eコマース、保険、医療、観光コンサルティング、アフターメンテナンス、ブランドプランニング、3C製品、教育などの専門分野に適用できます。

ヘルプデスク

メール、ウェブ、SNS、電話、チャットなどあらゆるチャンネルからのリクエストに対応し、作業負荷を減らし、企業のコストを削減して業務効率向上をサポートします。

  • 3 – Module Message Single-sentence Annotation Data
  • 13,000,000 Groups – Man-Machine Conversation Interactive Text Data
  • 20,000 Sentences – TTS Female American Speaking English Speech Data
  • 13 Modules – Entity Name Single-sentence Annotation Data
  • 200,000単語 – 中国語テキストの韻律辞書

自動応答

お客様サポートセンターとお客様間の会話をテキストに変換し、内容の品質検査を実施し、顧客サービスのサービス品質を向上させます。

  • 140時間 – Eコマースカスタマーサービス音声データ
  • 555時間 – 業種別カスタマーサービス音声データ
  • 3,000時間 – カスタマーサービス音声データ(汎用)

自動翻訳

中国語と英語、中国と韓国、中国語とウイグル語、日本語と英語、韓国語と英語、ウイグル語と中国語などのペアデータ辞書を保有。主に翻訳Webサイト、翻訳アプリ、翻訳機器に適用されます。

画像翻訳

写真上の文字をテキストに変換して、自動翻訳します。
海外旅行、海外ショッピング、商品情報識別などのニーズに応えます。

  • 70,000枚 – 英語画像_OCRアノテーション
  • 220,000枚 – 中国語画像_OCRアノテーション
  • 14,980画像 – 8言語PPTのテキスト化

音声翻訳

リアルタイムに音声をテキスト化し、自動翻訳します。
チャット、入力、検索、注文、指示などの利用をサポートします。

  • 101時間 – ノイズデータ
  • 156人 – マレー語音声データ
  • 203人 – 騒音環境下での中国語音声データ
  • 831時間 – イギリス英語音声データ
  • 535時間 – ドイツ人が話す英語音声データ
  • 520時間 – フランス人が話す英語音声データ

テキスト翻訳

NLPテクノロジーを使用して、写真上の文字を翻訳したり、音声を翻訳先の言語の変換をサポートします。

  • 5,140,000セット – 中国語と英語翻訳データ
  • 440,000セット – 中国と韓国翻訳データ
  • 100,000セット – 中国語 – ウイグル語翻訳データ
  • 380,000セット – 日英翻訳データ
  • 460,000セット – 韓国語 – 英語翻訳データ
  • 39,000セット – ウイグル語 – 中国語翻訳データ

自動音声読上

テキストを音声に変換し自動読上ソフトに適用されます。
読上言語を選択し、外国語の学習に役立てます。

  • 20時間TTS女性アメリカ英語音声(2万文)
  • 200,000単語 – 中国語テキストの韻律辞書

データサービス

音声データ

画像データ

3Dデータ

ビデオ

音声

物体検出

オブジェクトセグメンテーション

キーポイント

プラットフォーム

  • AIデータ処理需要を解決するため、多年の業務経験を通じて、【Shujiajia Pro】を開発。
  • 【Shujiajia Pro】はクラウドソーシング(CS)によるデータ収集、アノテーション技術、安全納品などの機能を搭載し、お客様にデータ処理一連のサービスを提供。

Why Us

  1. データサービス先駆者

    • 100人以上のデータ管理エキスパート
    • 1,000社以上の先進的な顧客との取引実績
    • 2,000人規模のデータ処理要員
  2. インテリジェンスなデータ処理技術

    • 「Human-in-the-loop」に基づくデータ認識処理の特許を保有
      【音声自動認識】
      【顔、ボディキーポイントアノテーション】
      【物体検出アノテーション】
  3. 厳格な品質検査管理

    • プロフェッショナルデータ品質検査チーム
    • ISO9001品質管理システム
    • データ正確率:95%~98%

会社情報

Datatangは、世界トップクラスの人工知能データサービスプロバイダー。
データリソース、技術力と豊富なデータ処理経験に基づき、2011年創業以来、全世界1,000社以上の人工知能企業や研究機関にハイクオリティなデータサービスを提供してきました。

MORE

プライバシーポリシー

当社は、当社が取り扱う全ての個人情報の保護について、社会的使命を十分に認識し、本人の権利の保護、個人情報に関する法規制等を遵守します。また、以下に示す方針を具現化するための個人情報保護マネジメントシステムを構築し、最新のIT技術の動向、社会的要請の変化、経営環境の変動等を常に認識しながら、その継続的改善に、全社を挙げて取り組むことをここに宣言します。

MORE
Contact Us

Datatang株式会社
(データ・タング株式会社)

本社
〒101-0063 東京都千代田区神田淡路町2-105 ワテラスアネックス6階
TEL
03-6256-8911
MAIL
sales@datatang.co.jp