ジェネレーティブ AI は人工知能の新しい波: クリエイティブ向けのアプリケーションのクラウド

AI の海の新しい波はジェネレーティブ AI です。しかし、これは人間の創造性の終わりでしょうか？

私たちはまだ技術を持っていません メタバース、メタの苦難が示すように。テスラオートパイロットの頻繁な不具合が示すように、自動運転車にはそれがありません。しかし、誰かがこれらの技術を実験室から持ち出すために懸命に取り組んでおり、おそらく私たちの経験にも何かが起こるのを見るでしょう. それは テクノロジー 重要で、変革的で、一般的なものであり、独自の十分な開発時間を必要とします。

それまでの間、AI の慰めの賞品を楽しむことができます。これらは、まだ不完全なメジャーのハイブリッド技術または部下です。その中には、「誓い」を引き出すものもあります。ジェネレーティブ AI これは、人工知能の海における新しい波です。

また、それはオープンなテクノロジーであり、私たちの作品の創造的なレベルを高め、エリートだけでなくすべての人に利益をもたらすことができるため、「誓い」を破ってください。ハイテク.

書き込み ケビンルーズ、ニューヨークタイムズのテクノロジーコラムニストは、「シリコンバレーでは、暗号とメタバースが出ています。ジェネレーティブ AI が登場します。」

AI の創造的な側面

ジェネレーティブ AI は、人工知能の一分野、たとえば創造的な側面を包含する「包括的」な用語です。ジェネレーティブ AI は、自然言語 (英語など) による単純な入力から始めて、テキスト、画像、ビデオ、およびコードを自律的に生成できます。今のところ、最もうまく機能する側面は、 イメージ作成.

これは、最も人気のあるアプリケーションの 2 つである DALL-E 650 (ダリと発音) で生成する画像のテキスト記述の例です。テキストボックスでは、達成したいことを説明できます。たとえば、「デジタルアートとしての別の次元へのポータルである一杯のスープ」などです。この入力を受け取ると、システムはこのような超現実的な画像を生成します。 DALL-E には XNUMX 億 XNUMX 万枚の画像のデータベースがあり、被写体を撮影して拡散モデルと呼ばれる手法でそれらをマージします。

すごいですね。この技術が AI の先駆けとなったのも不思議ではありません。

一瞬のヒット

2022 年は、ジェネレーティブ AI アプリケーションにとって決定的な年になるようです。とは異なり NFT そして、依然としてエリート現象であるメタバースの中でも、これらのアプリケーションには非常に多くのユーザーがいます。

DALL-E 2、画像ジェネレーター OpenAI 2021 年 XNUMX 月に利用可能になった (創設者の中にイーロンマスクがいる Microsoft とリンクしている研究所) は、すでに XNUMX 万人近くのユーザーが XNUMX 日 XNUMX 万枚以上の画像を作成しています。

ミッドジャーニー、別の画像生成アプリケーション (芸術的な作成に精通している) は、2022 年 XNUMX 月に発表され、今日ではすでに XNUMX 万人を超えるユーザーが Discord サーバーに群がっていると主張しています。

Google、Meta、および Microsoft も独自の画像ジェネレーターを作成しましたが、まだリリースしていません。それらはそれぞれImagenと呼ばれ、 メイク・ア・シーン e NUWA インフィニティ.

ジェネレーティブ AI は、数年前に、 GPT-3 ソフトウェア、それを深く使用していたGoogleのエンジニアに、感覚的な「もの」に直面しているような感覚を与えました.

Wired の投稿で、未来学者の Kevin Kelly は、Midjourney、Stable Diffusion、Artbreeder、DALL-E などの生成 AI アプリケーションで 20 日に生成される XNUMX 万を超える画像について語り、次のようにコメントしています。エンジン。

新しいFoMO

これらの数値は、よく知られている FoMO (Fear of Missing Out) を常に追い求めているベンチャー投資家の味覚にとって喜ばしいものであり、FoMO はしばしば「資本粉砕機」となります。

安定性、報告 Roose, la スタートアップ ほんの数か月前に発表された、画像生成アルゴリズムである安定した拡散は、すでにユニコーンになっている評価で、最近100億以上の資金を調達しました。

Always Roose は、Jasper が、 広告文案作成 はマーケター向けで、すでに 125 億 1,5 万ドルを調達し、XNUMX 億ドルの評価額を達成しています。

他の新興企業は、ゲーム、プログラミング、広告などの業界のアプリケーションのために膨大なリソースをかき集めています。主要なベンチャーキャピタル会社である Sequoia Capital は、ブログ投稿で、ジェネレーティブ AI が「数兆ドルの経済的価値」を生み出すことができると信じていると書いています。

安定拡散の場合

これまでのところ、ジェネレーティブ AI プロジェクトでこれほど誇大宣伝されたものはありません。 安定拡散.

これは主に、作成者によって注意深く監督されている多くの同様のプロジェクトとは異なり、Stable Diffusion が オープンソースプロジェクト 無料で使用できます。これは、誰でもソースコードにアクセスし、それをダウンロードして、変更されたバージョンを開発できることを意味します。同社によると、この夏にコードがリリースされて以来、200.000 人以上がこのコードを入手しており、Stable Diffusion アルゴリズムに基づくツールを使用して何百万もの画像が作成されています。

そして、これまでのところとても良いです。ただし、かなりの問題を引き起こしている側面が XNUMX つあります。 安定性. これらは私たちが知っている問題であり、パブリックドメインのツールが動作しています。ユーザーが暴力的、ポルノ、または著作権を侵害するコンテンツを含む画像を生成することを防止するための厳格なルール (ワードブラックリストを介して) を持つ他の画像ジェネレーターとは異なり、Stable Diffusion には非常に緩いセキュリティフィルターが付属しており、ユーザーがビルドすることで簡単に無効にすることができます。アプリケーションの独自のバージョン。

Roose の調査によると、ボーダーラインコンテンツの制作はすでに大規模に行われており、その結果を心配している社会は、効果的なフィルターを導入することなく、「母親を困らせるようなものを作成しない」という原則を確立することで介入しています。 .

Stability の創設者兼 CEO、 エマド・モスク、パノプティックシステムを構築した大手インターネット企業の支配を受けない人工知能を構築するための前提条件のXNUMXつは、根本的な創造的自由であるため、コンテンツ制限を導入するという考えを拒否しました.

Mostaque 氏は、ジェネレーティブ AI を何十億もの人々の手に渡せば、 新しい機会. それは確かに起こります。

クリエイティブな職業への影響

何年もの間、人工知能と自動化により、人工知能に関連する専門職が消滅すると広く信じられてきました。 手作業 繰り返します。運送業者、レジ係、倉庫労働者、組立ライン労働者はロボットによって職を失い、アート、エンターテイメント、メディアなどのクリエイティブ産業の労働者は、ロボットによって生み出される雇用の影響から除外されると考えられていました.

さて、最近予期せぬ出来事が起こりました。人工知能がリベラルでクリエイティブな職業に参入したのです。

Kevin Roose はこの点について次のように書いています。しかし、これらのツールがすでにクリエイティブ業界で使用されていることは明らかです。」

そして、そうです。で生成された表現 DALL-E2の名作を見事に融合させた架空の作品で構成されています。 ヤンフェルメール, ミルクガール (アムステルダム国立美術館) フランダース派の絵画の他の部分とともに オグルヴィ・パリ、世界最大のADV会社であるWPPの一部であり、「ラ・レティエール」製品ラインの広告キャンペーンのために ネスレ フランス市場向け。

クリエイティブ産業におけるジェネレーティブ AI の使用例

New York Times のレポーターは、ビジネスでジェネレーティブ AI アプリケーションを定期的に使用しているクリエイティブ業界の専門家の XNUMX つの事例を報告しています。

コリン・ヴァルドック、29 歳、ブルックリン出身のビデオゲームデザイナー ドリームスタジオ オンラインゲームで使用するキャラクターやアイテムを作成する。コスト: 数分間の作業に加えて、画像を使用するための数セント。これらのアプリケーションには、クレジット請求システムがあります。たとえば、30 クレジット (30 枚の画像を使用できる) は 15 ドルです。

イザベラ・ベアーズ、24 歳、サンフランシスコのインテリアデザイナーは、ジェネレーティブ AI を使用して家具付きスペースのモックアップを作成しています。顧客が提供する予定の部屋の写真をインテリア AI アプリにアップロードし、フィルターを適用して新しい家具のレンダリングを取得します。

パトリッククレア、40 歳、オーストラリアのシドニー出身の映画製作者は、DALL-E 2 を使用して、制作会社に提出する映画設定のプレゼンテーションを準備しています。このツールは、仮想アダプテーションとステージデザインを作成するために利用できる他のどのツールよりもはるかに優れていることがわかります。

ジェイソン・カーメル、49 歳は、ニューヨークの広告代理店 Wunderman の幹部です。彼のチームは、ポーカーテーブルにいる犬の画像など、画像をゼロから作成しなければならないことに気付くことがあります。従来の方法で作成すると、デザイナーは丸一日かかる作業になり、おそらくそれが機能しないことに気付くだけです。 DALL-E 2 を使用すると、数秒で実行できます。そして、それからnバージョンを作ることができます。

サラ・ドラモンド、33 歳、ロンドンのグラフィックサービスの従業員は、Midjourney または DALL-E 2 を使用して、サイネージ用の白黒の漫画をデザインしています。以前は、いわゆる「ブロブドローイング」と呼ばれるスケッチの準備に多くの時間を費やしていました。ジェネレーティブ AI アプリケーションを使用すると、数分で完了します。

…そしてその結果は？

いずれにせよ、これらすべての専門家は、ジェネレーティブ AI が創造的な仕事において非常に有用なツールであることに同意していますが、この分野の職業を完全に置き換えることは決してありません。少なくとも今のところ、私は付け加えるかもしれません。

ただし、剽窃、著作権、芸術的財産、および作品の世界に関連する多くの難しい質問から生じる、良い「しかし」があります。おそらく、すべての中で最も偉大な人が XNUMX 人いる、と彼は書いています。 トム・ファーバー 『フィナンシャル・タイムズ』では、これは「人類の創造性の終わりの始まりですか？」.

良い質問であり、おそらく最善のことは、それを尋ねないことです. しかし、XNUMX つ確かなことは、アートとクリエイティビティの歴史は、技術面だけでなく内容面でもテクノロジーと密接に絡み合っているということです。そして、アートがテクノロジーに取って代わられたことは一度もありません。

ソース：

Kevin Roose、ジェネレーティブ AI のカミングアウトパーティー、シリコンバレーの新しい流行、ニューヨークタイムズ、21 年 2022 月 XNUMX 日
Kevin Roose、AI 生成アートはすでに創造的な仕事を変革しています、ニューヨークタイムズ、21 年 2022 月 XNUMX 日
Tom Faber、AI 生成アートの黄金時代が到来。奇妙になるだろう、フィナンシャルタイムズ、27 年 2022 月 XNUMX 日
ケビン・ケリー、あなたの指先で無限の創造性を描く、ワイヤード、17 年 2022 月 XNUMX 日