画像生成AIモデル「通義万相」
通義万相は、さまざまなタスクを処理することに優れている生成AIモデルです。中国語や英語のテキストプロンプトに応答し、水彩画、油彩画、中国画、アニメーション、スケッチ、フラットイラスト、3D漫画など、多様なスタイルのディテールに富んだ画像を生成します。また、このモデルは、任意の画像を類似したスタイルの新しい画像に変換したり、スタイル転送によって画像をスタイリッシュに変化させたりすることが可能です。これにより、元の画像の内容を保持しながら、別の画像の視覚スタイルを適用することができます。
アリババクラウドの知識整理、視覚AI、自然言語処理(NLP)における先駆的なテクノロジーを搭載した本モデルは、多言語素材を活用してトレーニングを強化しています。意味理解能力が高く、文脈に即したより正確な画像生成を実現します。
さらに、高解像度の拡散プロセスをS/N比(signal-to-noise ratio)に基づいて最適化することで、このモデルは構図の正確さと鮮明なディテールをバランスよく保ちながら、高コントラストで視覚的に美しい背景画像を生成する能力を強化しています。
通義万相は、アリババクラウド独自の大型モデルであるComposerを使用して開発され、画像合成の品質と創造性を維持しながら、空間レイアウトやパレットなどの最終的な画像出力をより細かく制御することができます。
■通義万相によるテキストから画像への生成例
出典元:アリババグループ
引用:https://prtimes.jp/main/html/rd/p/000000094.000098612.html
※詳細については出典元の企業にお問い合わせください。
マナミナは" まなべるみんなのデータマーケティング・マガジン "。
市場の動向や消費者の気持ちをデータを調査して伝えます。
編集部は、メディア出身者やデータ分析プロジェクト経験者、マーケティングコンサルタント、広告代理店出身者まで、様々なバックグラウンドのメンバーが集まりました。イメージは「仲の良いパートナー会社の人」。難しいことも簡単に、「みんながまなべる」メディアをめざして、日々情報を発信しています。