博報堂テクノロジーズ、日本語特化の視覚と言語を組み合わせた事前学習モデルを開発

博報堂テクノロジーズ、日本語特化の視覚と言語を組み合わせた事前学習モデルを開発

株式会社博報堂テクノロジーズは、日本語に特化した画像とテキストの理解を深めるための視覚言語事前学習モデルを開発したことを発表しました。本モデルはHugging Face上で無償公開(ただし非商用に限る)されます。


多くの視覚言語事前学習(Vision-Language Pre-training; VLP)技術は、英語中心の開発により、日本語データへの対応が不十分でした。

博報堂テクノロジーズは、画像エンコーダの改良と訓練データ量の増加、言語エンコーダの能力強化を通じ、日本語特化VLPモデルを開発。本モデルにより、例えば「桜の花が満開の公園」など具体的なシーンを日本語で検索した際、関連度の高い画像を正確に見つけ出すことが可能になるとのことです。

詳細情報

開発したVLPモデルの技術的詳細や応用例については、博報堂テクノロジーズの公式Hugging Faceページを通じて提供されます。以下のリンクから、モデルの使用や研究への応用が可能です。

Japanese CLIP ViT-H/14 (Base)

hakuhodo-tech/japanese-clip-vit-h-14-bert-base · Hugging Face

https://huggingface.co/hakuhodo-tech/japanese-clip-vit-h-14-bert-base

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Japanese CLIP ViT-H/14 (Deeper)

hakuhodo-tech/japanese-clip-vit-h-14-bert-deeper · Hugging Face

https://huggingface.co/hakuhodo-tech/japanese-clip-vit-h-14-bert-deeper

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Japanese CLIP ViT-H/14 (Wider) ※検索精度最高のモデル、推奨モデル

hakuhodo-tech/japanese-clip-vit-h-14-bert-wider · Hugging Face

https://huggingface.co/hakuhodo-tech/japanese-clip-vit-h-14-bert-wider

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

出典元:株式会社博報堂テクノロジーズ

引用:https://prtimes.jp/main/html/rd/p/000000019.000113498.html

※詳細については出典元の企業にお問い合わせください。

この記事のライター

マナミナは" まなべるみんなのデータマーケティング・マガジン "。
市場の動向や消費者の気持ちをデータを調査して伝えます。

編集部は、メディア出身者やデータ分析プロジェクト経験者、マーケティングコンサルタント、広告代理店出身者まで、様々なバックグラウンドのメンバーが集まりました。イメージは「仲の良いパートナー会社の人」。難しいことも簡単に、「みんながまなべる」メディアをめざして、日々情報を発信しています。

関連するキーワード


マーケティング

関連する投稿


インフルエンサー広告サービス『Vooster』が新たにTikTok連携を開始

インフルエンサー広告サービス『Vooster』が新たにTikTok連携を開始

株式会社Voosterは、同社が提供するAIによる自動運用型のインフルエンサー広告サービス『Vooster(ブースター)』が、新たにTikTok対応を開始したことを発表しました。


Z世代の81%がPR表記に警戒感!?商品選びはメガインフルエンサーより専門性・人柄重視【Z-SOZOKEN調査】

Z世代の81%がPR表記に警戒感!?商品選びはメガインフルエンサーより専門性・人柄重視【Z-SOZOKEN調査】

Fiom合同会社は、同社運営する、Z世代当事者が実態や価値観を分析するシンクタンク「Z-SOZOKEN(Z世代創造性研究所)」 にて、全国のZ世代(18歳〜24歳)を対象に「Z世代の情報信頼度についての実態調査」 を実施し、結果を公開しました。


ニュースを「ほぼ毎日」チェックする高校生・大学生は4~5割!内容が本当か?と感じたときは「情報源が何なのか/信頼できるか、調べる」が最多【LINEリサーチ調査】

ニュースを「ほぼ毎日」チェックする高校生・大学生は4~5割!内容が本当か?と感じたときは「情報源が何なのか/信頼できるか、調べる」が最多【LINEリサーチ調査】

LINEリサーチは、全国の15~25歳の学生(高校生、専門学生、短大生、大学生、大学院生)の男女を対象に、ニュースを見聞きしたり、チェックしたりする頻度・方法・場所・ジャンルや、気になるニュースをさらに調べる方法について調査を実施し、結果を公開しました。


推し活層の誕生日消費、公式イベント無しでも平均1万円【Oshicoco調査】

推し活層の誕生日消費、公式イベント無しでも平均1万円【Oshicoco調査】

株式会社Oshicocoは、『推しの誕生日祝い』に関するアンケートを実施し、結果を公開しました。


エビリー、2026年WBCのYouTube視聴動向の分析結果を公開

エビリー、2026年WBCのYouTube視聴動向の分析結果を公開

株式会社エビリーは、同社が提供するYouTubeデータ分析ツール『kamui tracker(カムイトラッカー)』を用い、2026年3月に開催されたワールド・ベースボール・クラシック(WBC)について、YouTube上の関連動画動向を分析した結果を公開しました。


ページトップへ