友快網

導航選單

OpenAI正式開放影象模型DALL·E 2程式介面,DALL·E 2使用者已超300萬人

掃碼瞭解詳情

近日,人工智慧公司 OpenAI 宣佈,開發者可以將文字生成影象模型 DALL·E 2, 直接整合到其應用程式和產品中。

OpenAI 在官網表示,截至 11 月 3 日,已經有超過 300 萬人使用 DALL·E 2,每天建立的圖片數量達到 400 萬張。而在 9 月 28 日,DALL E 2 被允許所有人註冊並使用,當時使用者量有 150 多萬,每天生成的影象約 200 萬張。即在一個月左右的時間裡,DALL·E 2 的使用人數和生成圖片數量都翻了一倍。

如今當更多開發人員和企業將 DALL-E 2 整合到其應用中後,該模型的影響力無疑會進一步擴大。

目前,OpenAI 已經與一些客戶合作。比如,微軟正在將 DALL·E 2 引入其新發布的 Designer 圖形設計應用程式中,可幫助使用者建立專業的社交博文、邀請函、幻燈片設計等。DALL·E 2 也在微軟的藝術生成器工具 Image Creator 所整合,如果使用者沒有搜尋到他們想要的內容,則可自己建立影象。值得一提的是,微軟也是 OpenAI 的重要資助者。

另外,圖片公司 Mixtiles 正在使用 OpenAI 開放的 API(Application Program Interface,應用程式介面),生成海報和藝術畫作;時裝設計公司 CALA 也正在藉助 DALL·E 2 生成新的產品構思理念。

目前,透過使用 DALL·E 2 的 API,可實現 3 種與影象互動的方法:根據文字提示從頭開始建立影象、根據新的文字提示建立現有影象的編輯、建立現有影象的變體。

生成的影象的大小有 256x256、512x512 或 1024x1024 畫素三種規格。尺寸較小的影象生成速度更快。

圖 | 在現有基礎上,對影象進行編輯和擴充套件(來源:OpenAI)

OpenAI 在官網表示:“隨著研究的發展,將繼續把最先進的技術引入 API,包括在影象質量和可用性等方面的進步。我們非

常希望看到客戶使用 DALL·E 2 產生出各種創意。”

據瞭解,DALL·E 2 釋出於 2022 年 4 月(同年 7 月進入測試階段),藉助於該模型,使用者只需簡單輸入一些文字描述,就可以將文字描述的場景以圖片的形式真實展現出來。目前使用者能免費生成一定數量的影象,額外的影象則需要付費。

DALL·E 2 透過一種名為“擴散”的過程,來理解文字和對應影象間的關係。除了可以生成和編輯影象,它還可以組合概念、屬性和樣式,並將原始畫像進行擴充套件,從而建立廣闊的新構圖或生成原圖的變體。

值得注意的是,當前的文字生成影象 AI 仍存在一些問題。這些系統可能產出某些有害內容,並在資料使用方面存在著版權和道德風險。

對於此,OpenAI 已採取一定措施,來防止 DALL·E 2 生成暴力、仇恨或色情影象,像將模型訓練資料中的有害內容進行刪除,並透過過濾器(還設定了自動化和人工監控系統),禁止生成和上傳可能違反其政策的文字提示和圖片。

該公司還採取了相關技術來防止現實人物(包括歷史公眾人物)的面部生成。總之, OpenAI 正儘可能減少 DALL·E 2 對不良內容的接觸。

在官方博文中 OpenAI 還提到,他們從全球 300 萬使用 DALL·E 2 的使用者中,得到了很多有關安全方面的經驗教訓,將繼續把信任和安全作為首要任務,以便所有人能夠專注於作品構建。

DALL·E 2 系統雖然廣受使用者歡迎,但文字生成影象模型正在快速發展,它也面臨著多方的競爭,像 Midjourney 和 Stability AI,兩者目前對使用者的限制較少。

然後,還有一個值得關注的問題是,像 DALL·E 2這樣的 AI 系 統,訓練所用的資料大都直接來自網際網路,包括攝影師、設計人員等的版權作品。

對於自己的作品被使用,藝術家們不僅沒有得到補償,文字生成影象模型還可能會模仿他們的風格,甚至產出侵犯版權的作品。這讓很多人類創作者感到不滿甚至憤怒。

不過,某些開發文字生成影象系統的公司,例如 Shutterstock,最近對外表示正在建立一個貢獻者基金,以補償為訓練 AI 提供資料的個人。

對於提供補償等解決方案,據悉,OpenAI 目前還沒有相關計劃。該公司負責 API 的產品經理盧克·米勒(Luke Miller)告訴媒體,這是一個非常複雜的問題,需要從很多不同的角度來考慮,公司會從社群等渠道繼續尋求使用者的反饋。

同時,他也對外提到,用 DALL·E 2 建立影象,其實與其他作品的創作過程沒有什麼不同,人們首先提出自己的想法,並不斷進行調整修改,逐漸取得適合自己需求的滿意作品。

參考資料:

https://openai。com/blog/dall-e-api-now-available-in-public-beta/

https://beta。openai。com/docs/guides/images/introduction

https://openai。com/dall-e-2/

https://www。theverge。com/2022/11/3/23438604/text-to-image-ai-openai-dall-e-api-public-beta-price

https://venturebeat。com/ai/dall-e-api-released-by-openai-in-public-beta/

炒股開戶享福利,入金抽188元紅包,100%中獎!

開啟App看更多精彩內容

上一篇:記一次裝機,13900KF+情人節禮物4090+Z790平臺
下一篇:唐藝昕出“大招”,露臍背心配綠色毛絨外套,不好好穿衣大秀香肩