AI技術で進化するDAMとPIMの可能性とその活用法とは

ChatGPTに代表される生成AIの登場によりAIが益々身近になってきました。あらゆる業界で活用が加速しているAI技術ですが、企業の販促・マーケティング活動で活用が進むデジタルアセット管理(DAM)や商品情報管理(PIM)の分野も大きな影響を受けています。動画や画像などの大規模なデジタルアセット情報や膨大な商品情報を管理するDAMとPIMではシステムの生産性向上を目的に積極的にAIの導入が進んでいます。このコラムではAIがDAMとPIMの分野でどのように活用されており、さらに今後はどのように発展していくのか検討していきます。

1.DAM|PIMの視点から見たAIを支える技術
DAMは媒体・コンテンツの制作・管理・配信環境を支援するDXとして注目を集めています。古くは印刷・出版媒体業界で普及が進み、現在では企業の販促・マーケティング活動におけるDXとして、商品情情報の切り口からPIMと連携する事も多く、WEB/EC/SNSなどのデジタル媒体の生産性向上とブランディング強化をターゲットに広く活用されています。
この様にDAMとPIMは各種媒体・コンテンツの制作・管理・配信環境における写真・動画・イラスト・CG・テキストなどのデジタルアセットと商品に関わるあらゆる情報の管理を行い、これらのデータの入力・保存・整理・検索・共有・出力までのワークフローをサポートする事になります。
それでは代表的なAI技術を整理しながら、DAM|PIMのワークフローの中での活用方法をイメージしてみてください。
<AIを支える技術とDAM|PIMとの接点を考える>
機械学習(ML)
MLはAIのベースとなる技術で、データを解析し、そのデータから学習した内容を応用して、十分な情報に基づく判断を下すアルゴリズムを含みます。特定のデータセットでMLアルゴリズムをトレーニングすることで、データ内のパターンを識別し、予測を行ったり、新しいデータセットで同様のパターンを認識したりできます。たとえば、さまざまな犬種の画像を使用して MLアルゴリズムをトレーニングすると、最終的にはジャーマン シェパードをゴールデン レトリバーや他の犬種と区別できるようになります。
ディープラーニング(DL)
DLは機械学習の一種であり、アルゴリズムを階層構造にして、「人工ニューラルネットワーク」を構築します。基本的な機械学習モデルの場合、与えられた機能が何であるかによらず、精度は徐々に向上していくものの、人間による一定の指示が必要なのは変わりません。しかしながら、ニューラルネットワークは、学習とインテリジェントな判断を自分で行うことができます。ディープラーニングの活用により画像認識や音声認識そして自然言語処理などの活用が拡がります。
自然言語処理(NLP)
NLPは、コンピューターが人間の言語を分析および理解できるようにすることに特に焦点を当てたAIの一分野です。人間が日常的に使っている言語を機械で処理し、内容を抽出する技術です。具体的には、テキストデータの解析や非構造化データの処理ができるため、マーケティング分野などで広く活用されています。
自然言語は日常的に人が使用する言葉であり、曖昧さを含んでいます。同じ言葉でも、話す人物や文脈によって違う意味を示すことも珍しくありません。そのため、コンピューターで機械的に分析するには高度な技術が求められます。
大規模言モデル(LLM)
LLM:Large Language Modelsとは、膨大な「計算量」「データ量」「パラメータ数」で構築された自然言語処理モデルです。パラメータ数に関する定義はありませんが、数十億以上のパラメータをもつ言語モデルを指すのが一般的です。パラメータ数が多いと、より高度な言語生成能力をもつようになります。その結果、自然で流暢なテキストの生成や、複雑な質問への回答などが可能となるのです。
一般的な言語モデルはAIスピーカーや文書分類や機械翻訳などの単純なタスクに用いられます。一方、大規模言語モデルは文章生成や質問応答など、より複雑なタスクに用いられます。
コンピューター・ビジョン
コンピューター・ビジョンとは、コンピューターとシステムがデジタル画像や動画、その他の視覚データから意味のある情報を導き出し、その情報に基づいて対処し、推奨を行うことがきるようにする人工知能(AI)の分野のことです。画像をスキャンする際、AI システムは画像認識、物体認識、顔認識などの技術を使用します。AIアルゴリズムは、画像や動画を注意深く調べ、視覚コンテンツに存在する画像、物体、人間の特徴の識別に役立つ視覚的な手がかりを探します。
Transformer
AIの性能を向上させるためのディープラーニングモデルの一種です。この革新的な技術は自然言語処理の領域を一新しGPT、BERT、PaLMなどの最先端モデルの基盤となっています。Transformer自体は、系列データをベクトルに変換して処理を行うEncoder-Decoderモデルです。大規模な事前学習を行い、その後タスク固有のファインチューニングを行うことで、機械翻訳や画像そして文書生成などに幅広く応用されています。
この様にDAMとPIMは各種媒体・コンテンツの制作・管理・配信環境における写真・動画・イラスト・CG・テキストなどのデジタルアセットと商品に関わるあらゆる情報の管理を行い、これらのデータの入力・保存・整理・検索・共有・出力までのワークフローをサポートする事になります。
それでは代表的なAI技術を整理しながら、DAM|PIMのワークフローの中での活用方法をイメージしてみてください。
<AIを支える技術とDAM|PIMとの接点を考える>
機械学習(ML)
MLはAIのベースとなる技術で、データを解析し、そのデータから学習した内容を応用して、十分な情報に基づく判断を下すアルゴリズムを含みます。特定のデータセットでMLアルゴリズムをトレーニングすることで、データ内のパターンを識別し、予測を行ったり、新しいデータセットで同様のパターンを認識したりできます。たとえば、さまざまな犬種の画像を使用して MLアルゴリズムをトレーニングすると、最終的にはジャーマン シェパードをゴールデン レトリバーや他の犬種と区別できるようになります。
ディープラーニング(DL)
DLは機械学習の一種であり、アルゴリズムを階層構造にして、「人工ニューラルネットワーク」を構築します。基本的な機械学習モデルの場合、与えられた機能が何であるかによらず、精度は徐々に向上していくものの、人間による一定の指示が必要なのは変わりません。しかしながら、ニューラルネットワークは、学習とインテリジェントな判断を自分で行うことができます。ディープラーニングの活用により画像認識や音声認識そして自然言語処理などの活用が拡がります。
自然言語処理(NLP)
NLPは、コンピューターが人間の言語を分析および理解できるようにすることに特に焦点を当てたAIの一分野です。人間が日常的に使っている言語を機械で処理し、内容を抽出する技術です。具体的には、テキストデータの解析や非構造化データの処理ができるため、マーケティング分野などで広く活用されています。
自然言語は日常的に人が使用する言葉であり、曖昧さを含んでいます。同じ言葉でも、話す人物や文脈によって違う意味を示すことも珍しくありません。そのため、コンピューターで機械的に分析するには高度な技術が求められます。
大規模言モデル(LLM)
LLM:Large Language Modelsとは、膨大な「計算量」「データ量」「パラメータ数」で構築された自然言語処理モデルです。パラメータ数に関する定義はありませんが、数十億以上のパラメータをもつ言語モデルを指すのが一般的です。パラメータ数が多いと、より高度な言語生成能力をもつようになります。その結果、自然で流暢なテキストの生成や、複雑な質問への回答などが可能となるのです。
一般的な言語モデルはAIスピーカーや文書分類や機械翻訳などの単純なタスクに用いられます。一方、大規模言語モデルは文章生成や質問応答など、より複雑なタスクに用いられます。
コンピューター・ビジョン
コンピューター・ビジョンとは、コンピューターとシステムがデジタル画像や動画、その他の視覚データから意味のある情報を導き出し、その情報に基づいて対処し、推奨を行うことがきるようにする人工知能(AI)の分野のことです。画像をスキャンする際、AI システムは画像認識、物体認識、顔認識などの技術を使用します。AIアルゴリズムは、画像や動画を注意深く調べ、視覚コンテンツに存在する画像、物体、人間の特徴の識別に役立つ視覚的な手がかりを探します。
Transformer
AIの性能を向上させるためのディープラーニングモデルの一種です。この革新的な技術は自然言語処理の領域を一新しGPT、BERT、PaLMなどの最先端モデルの基盤となっています。Transformer自体は、系列データをベクトルに変換して処理を行うEncoder-Decoderモデルです。大規模な事前学習を行い、その後タスク固有のファインチューニングを行うことで、機械翻訳や画像そして文書生成などに幅広く応用されています。
2.DAM|PIMワークフローの中で活用が期待されるAI技術
DAM |PIMでAIが果たす役割と、AI技術を搭載したDAM |PIMソリューションが企業活動の生産性向上やブランディングの強化にどのようにつながっていくのかを考えてみます。
DAM |PIMは、単にデジタル資産や商品情報を管理するだけではありません。これらコンテンツの活用をより一層促進するため、利便性や柔軟性など迅速なコンテンツ活用のためのスマートな機能を提供する必要があります。そこでAIが重要な役割を果たします。DAM |PIMにおけるメタデータの管理の改善、検索と発見のプロセスの強化、ワークフローと自動化の合理化など様々なシーンでAI技術が活用されます。
<具体的なAI技術について>
1.自動タグ付けとメタデータ生成:
DAMユーザーは、アップロードされた各デジタルアセットにキーワードを1つずつ手動で適用する必要があり、時間がかかる場合があります。AIシステムは画像や動画をスキャンし、その中のオブジェクトを認識し、関連するキーワードをタグとして適用することができます。自動タグ付けを使用すると、DAM ソリューションにタグ付けを行いメタデータの自動生成が可能になります。
2.類似画像検索:
AIを活用した類似画像検索を使用すると、キーワードの推測や複雑な分類システムに頼ることなく、必要な特定の画像や動画を簡単に見つけることができます。DAMシステムは、AIを活用した画像認識を使用することで、類似したコンテンツを含む画像の確率を計算できます。これにより、メタデータベースの検索と連動する新しい方法で画像を検出できます。
3.自然言語検索:
ChatGPTに見られる様な自然な言葉や文章によるDAM|PIMシステム内の情報の検索と入手が可能になります。自然言語検索は、単語の組み合わせや文脈を考慮して検索できるため、複雑な要求にも対応できます。また自分の言葉でクエリを入力できるため、直感的で使いやすく、キーワード検索よりもユーザーの意図を正確に捉えることができます。
4.音声テキスト変換:
AIは、音声からテキストへの変換と呼ばれる優れた機能を通じてDAMシステムをサポートします。音声ファイルの文字起こし作業には時間がかかる場合がありますが、この機能により音声やビデオファイルをテキストに書き起こすのに必要な時間が大幅に短縮されます。必要な音声ファイルやビデオファイルを簡単に見つけられる事は大規模なDAMシステムにとって重要です。 5,OCR機能:
AIはOCR機能によってDAMシステムに登録されている画像や動画内にあるイメージとしてのテキスト情報を抽出し、テキストデータに変換する事が可能です。テキスト変換されたデータはメタデータとして活用する事ができるので、テキストとして検索が可能になり、DAMシステム内の画像や動画を速やかに検索する事が可能になります。
以上のDAM |PIMワークフローにおけるAI技術の活用は、既に実用化されており当社(株式会社ビジュアル・プロセッシング・ジャパン)が提供しているCIERTO DAM|PIMにおいても利用可能になっています。詳しくは、こちらのサイト(DAMサイト)を参考にしてください。
DAM |PIMは、単にデジタル資産や商品情報を管理するだけではありません。これらコンテンツの活用をより一層促進するため、利便性や柔軟性など迅速なコンテンツ活用のためのスマートな機能を提供する必要があります。そこでAIが重要な役割を果たします。DAM |PIMにおけるメタデータの管理の改善、検索と発見のプロセスの強化、ワークフローと自動化の合理化など様々なシーンでAI技術が活用されます。
<具体的なAI技術について>
1.自動タグ付けとメタデータ生成:
DAMユーザーは、アップロードされた各デジタルアセットにキーワードを1つずつ手動で適用する必要があり、時間がかかる場合があります。AIシステムは画像や動画をスキャンし、その中のオブジェクトを認識し、関連するキーワードをタグとして適用することができます。自動タグ付けを使用すると、DAM ソリューションにタグ付けを行いメタデータの自動生成が可能になります。
2.類似画像検索:
AIを活用した類似画像検索を使用すると、キーワードの推測や複雑な分類システムに頼ることなく、必要な特定の画像や動画を簡単に見つけることができます。DAMシステムは、AIを活用した画像認識を使用することで、類似したコンテンツを含む画像の確率を計算できます。これにより、メタデータベースの検索と連動する新しい方法で画像を検出できます。
3.自然言語検索:
ChatGPTに見られる様な自然な言葉や文章によるDAM|PIMシステム内の情報の検索と入手が可能になります。自然言語検索は、単語の組み合わせや文脈を考慮して検索できるため、複雑な要求にも対応できます。また自分の言葉でクエリを入力できるため、直感的で使いやすく、キーワード検索よりもユーザーの意図を正確に捉えることができます。
4.音声テキスト変換:
AIは、音声からテキストへの変換と呼ばれる優れた機能を通じてDAMシステムをサポートします。音声ファイルの文字起こし作業には時間がかかる場合がありますが、この機能により音声やビデオファイルをテキストに書き起こすのに必要な時間が大幅に短縮されます。必要な音声ファイルやビデオファイルを簡単に見つけられる事は大規模なDAMシステムにとって重要です。 5,OCR機能:
AIはOCR機能によってDAMシステムに登録されている画像や動画内にあるイメージとしてのテキスト情報を抽出し、テキストデータに変換する事が可能です。テキスト変換されたデータはメタデータとして活用する事ができるので、テキストとして検索が可能になり、DAMシステム内の画像や動画を速やかに検索する事が可能になります。
以上のDAM |PIMワークフローにおけるAI技術の活用は、既に実用化されており当社(株式会社ビジュアル・プロセッシング・ジャパン)が提供しているCIERTO DAM|PIMにおいても利用可能になっています。詳しくは、こちらのサイト(DAMサイト)を参考にしてください。
3.DAM |PIMにおけるAI技術の今後の課題と動向
DAM |PIMワークフローにおけるAI技術の可能性と親和性は非常に高く、AI技術は今後もDAM |PIMのニーズを求めて改良され発展していくと考えられます。しかしながら考慮すべき課題や視点もいくつかあります。たとえば、DAM|PIMにとって最大の重要事項である画像認識やタグ付けにおける精度の向上やデータのプライバシーと高度なセキュリティ対策など留意する必要があります。またAIをフル活用しDAM |PIMシステムの運用を進め、本題である媒体・コンテンツの制作・管理・配信環境の生産性向上と企業ブランディングの強化を目指すには、より一層の経営陣の理解が必要になります。
DAM|PIMはAI技術の進歩と共にユーザーが必要とする信頼性の高い機能を提供し続けるでしょう。今後注目されるAIを活用したソリューションとして既存のコンテンツを活用したAIの画像や動画生成、生成AIによるアセットや商品情報の説明文作成、画像の切抜や画角調整とノイズ除去、そしてカスタマーサポートとFAQの自動応答などいくらでも上げられます。 DAM|PIMとAIの融合は、企業がデジタルアセットをより戦略的に管理し、マーケティング活動やブランディングにおいて新たな価値を生み出す手段となり得ます。この技術革新は、企業の競争力を高め、顧客体験を向上させるための重要なステップです。さらに、法的リスクを回避し、コンプライアンスの遵守を支援するという側面もあります。今後のAI技術の進歩とDAM|PIMシステムの発展に期待しましょう。
DAM|PIMはAI技術の進歩と共にユーザーが必要とする信頼性の高い機能を提供し続けるでしょう。今後注目されるAIを活用したソリューションとして既存のコンテンツを活用したAIの画像や動画生成、生成AIによるアセットや商品情報の説明文作成、画像の切抜や画角調整とノイズ除去、そしてカスタマーサポートとFAQの自動応答などいくらでも上げられます。 DAM|PIMとAIの融合は、企業がデジタルアセットをより戦略的に管理し、マーケティング活動やブランディングにおいて新たな価値を生み出す手段となり得ます。この技術革新は、企業の競争力を高め、顧客体験を向上させるための重要なステップです。さらに、法的リスクを回避し、コンプライアンスの遵守を支援するという側面もあります。今後のAI技術の進歩とDAM|PIMシステムの発展に期待しましょう。