OpenAI正式開放影象模型DALL·E 2程式介面，DALL·E 2使用者已超300萬人

掃碼瞭解詳情

近日，人工智慧公司 OpenAI 宣佈，開發者可以將文字生成影象模型 DALL·E 2，直接整合到其應用程式和產品中。

OpenAI 在官網表示，截至 11 月 3 日，已經有超過 300 萬人使用 DALL·E 2，每天建立的圖片數量達到 400 萬張。而在 9 月 28 日，DALL E 2 被允許所有人註冊並使用，當時使用者量有 150 多萬，每天生成的影象約 200 萬張。即在一個月左右的時間裡，DALL·E 2 的使用人數和生成圖片數量都翻了一倍。

如今當更多開發人員和企業將 DALL-E 2 整合到其應用中後，該模型的影響力無疑會進一步擴大。

目前，OpenAI 已經與一些客戶合作。比如，微軟正在將 DALL·E 2 引入其新發布的 Designer 圖形設計應用程式中，可幫助使用者建立專業的社交博文、邀請函、幻燈片設計等。DALL·E 2 也在微軟的藝術生成器工具 Image Creator 所整合，如果使用者沒有搜尋到他們想要的內容，則可自己建立影象。值得一提的是，微軟也是 OpenAI 的重要資助者。

另外，圖片公司 Mixtiles 正在使用 OpenAI 開放的 API（Application Program Interface，應用程式介面），生成海報和藝術畫作；時裝設計公司 CALA 也正在藉助 DALL·E 2 生成新的產品構思理念。

目前，透過使用 DALL·E 2 的 API，可實現 3 種與影象互動的方法：根據文字提示從頭開始建立影象、根據新的文字提示建立現有影象的編輯、建立現有影象的變體。

生成的影象的大小有 256x256、512x512 或 1024x1024 畫素三種規格。尺寸較小的影象生成速度更快。

圖 | 在現有基礎上，對影象進行編輯和擴充套件（來源：OpenAI）

OpenAI 在官網表示：“隨著研究的發展，將繼續把最先進的技術引入 API，包括在影象質量和可用性等方面的進步。我們非

常希望看到客戶使用 DALL·E 2 產生出各種創意。”

據瞭解，DALL·E 2 釋出於 2022 年 4 月（同年 7 月進入測試階段），藉助於該模型，使用者只需簡單輸入一些文字描述，就可以將文字描述的場景以圖片的形式真實展現出來。目前使用者能免費生成一定數量的影象，額外的影象則需要付費。

DALL·E 2 透過一種名為“擴散”的過程，來理解文字和對應影象間的關係。除了可以生成和編輯影象，它還可以組合概念、屬性和樣式，並將原始畫像進行擴充套件，從而建立廣闊的新構圖或生成原圖的變體。

值得注意的是，當前的文字生成影象 AI 仍存在一些問題。這些系統可能產出某些有害內容，並在資料使用方面存在著版權和道德風險。

對於此，OpenAI 已採取一定措施，來防止 DALL·E 2 生成暴力、仇恨或色情影象，像將模型訓練資料中的有害內容進行刪除，並透過過濾器（還設定了自動化和人工監控系統），禁止生成和上傳可能違反其政策的文字提示和圖片。

該公司還採取了相關技術來防止現實人物（包括歷史公眾人物）的面部生成。總之， OpenAI 正儘可能減少 DALL·E 2 對不良內容的接觸。

在官方博文中 OpenAI 還提到，他們從全球 300 萬使用 DALL·E 2 的使用者中，得到了很多有關安全方面的經驗教訓，將繼續把信任和安全作為首要任務，以便所有人能夠專注於作品構建。

DALL·E 2 系統雖然廣受使用者歡迎，但文字生成影象模型正在快速發展，它也面臨著多方的競爭，像 Midjourney 和 Stability AI，兩者目前對使用者的限制較少。

然後，還有一個值得關注的問題是，像 DALL·E 2這樣的 AI 系統，訓練所用的資料大都直接來自網際網路，包括攝影師、設計人員等的版權作品。

對於自己的作品被使用，藝術家們不僅沒有得到補償，文字生成影象模型還可能會模仿他們的風格，甚至產出侵犯版權的作品。這讓很多人類創作者感到不滿甚至憤怒。

不過，某些開發文字生成影象系統的公司，例如 Shutterstock，最近對外表示正在建立一個貢獻者基金，以補償為訓練 AI 提供資料的個人。

對於提供補償等解決方案，據悉，OpenAI 目前還沒有相關計劃。該公司負責 API 的產品經理盧克·米勒（Luke Miller）告訴媒體，這是一個非常複雜的問題，需要從很多不同的角度來考慮，公司會從社群等渠道繼續尋求使用者的反饋。

同時，他也對外提到，用 DALL·E 2 建立影象，其實與其他作品的創作過程沒有什麼不同，人們首先提出自己的想法，並不斷進行調整修改，逐漸取得適合自己需求的滿意作品。

參考資料：

https：//openai。com/blog/dall-e-api-now-available-in-public-beta/

https：//beta。openai。com/docs/guides/images/introduction

https：//openai。com/dall-e-2/

https：//www。theverge。com/2022/11/3/23438604/text-to-image-ai-openai-dall-e-api-public-beta-price

https：//venturebeat。com/ai/dall-e-api-released-by-openai-in-public-beta/

炒股開戶享福利，入金抽188元紅包，100%中獎！

開啟App看更多精彩內容

友快網

OpenAI正式開放影象模型DALL·E 2程式介面，DALL·E 2使用者已超300萬人

相關推薦

最近发表