友快網

導航選單

一文深度解讀達摩院推出的AI模型社群

11月3日,2022雲棲大會杭州現場,阿里達摩院聯手CCF開源發展委員會共同推出AI模型社群“魔搭”ModelScope,旨在降低AI的應用門檻。首批合作方還包括瀾舟科技、智譜AI、深勢科技、哈工大訊飛聯合實驗室、中國科學技術大學等多家科研機構。達摩院等率先向社群貢獻300多個經過驗證的優質AI模型,超過三分之一為中文模型,全面開源開放。

魔搭社群重點關注AI的應用難題。

為什麼AI應用難?

首先是開發門檻高,模型開發往往需要大量資料的準備,以及匹配的海量GPU算力。通常只有大公司才有這方面的投入,對於中小企業則存在一定的難度。

其二是模型的定製化需求高,在具體的問題上面,通用的模型效果不是特別好,還得做相應的定製化微調,這對開發人員提出了很高的要求。

第三是今天模型眾多,呼叫方式不同,AI開發者需要檢視很多的資料,來修改這個那個引數,使用不同模型的難度比較大。

最後,目前在國內沒有通用的模型交流平臺,缺乏系統化的模型分享渠道。這也導致了查詢模型、比較不同模型效果的門檻較高,最終導致模型交流分享的困難。

什麼是模型即服務?

為了解決這些實際的AI應用困難,達摩院提出了模型即服務Model as a Service的理念,魔搭社群就是踐行這種理念的產品。過去,我們通常會把硬體資源、通用的軟體能力、底層框架等來提供服務,現在,模型也上升到底層框架服務的維度,開始成為第一生產力。

與此同時,魔搭社群將模型、資料和演算法有機結合起來,來降低模型體驗的門檻,讓模型能夠被快速的被使用,並且能快速的被微調,最終讓適合具體業務場景的微調後的模型,能快速雲端部署。

達摩院希望透過模型即服務的理念,實現 AI for Everyone。無論是AI興趣者,使用者,開發者還是研究人員,都能夠在魔搭社群,很好的使用模型解決實際的問題。

模型豐富 中文特色

魔搭社群首批上架模型超過300個,覆蓋了視覺、語音、自然語言處理、多模態等AI主要領域,覆蓋任務超過60個。上架模型均經過專家篩選和效果驗證,包括150+SOTA(業界領先)模型和十多個大模型,均已開原始碼或開放使用。

社群鼓勵中文模型的開發和使用,希望實現中文模型的豐富供給,並更好滿足本土需求。目前已上架的中文模型超過100個,總量佔比超過三分之一,其中包括一批探索人工智慧前沿的中文大模型,如阿里通義大模型系列、瀾舟科技的孟子系列模型、智譜AI的多語言預訓練大模型。

展開來說:

在計算機視覺領域,社群開源了多種視覺任務近百個模型,覆蓋多模態圖文表徵大模型、影象/影片生成大模型,以及各類下游遷移應用模型,既有SOTA的技術熱門模型,也有久經考驗的應用模型,包括最基本的視覺理解,如識別分類、目標檢測、分割摳圖等,也包括視覺生產中的畫質增強、影象編輯、內容生成等大類,初步構建了以多模態生成和表徵大模型為基礎的開源模型體系。為AI開發者提供豐富的、一站式的視覺AI模型選擇。

在自然語言處理領域,社群提供了包括 structBert, PALM, mPLUG, 中文GPT3等預訓練模型為底座,共計100+ NLP 應用模型,涵蓋了分詞,詞性, 命名實體識別等基礎技術,文字分類,情感分類,對話問答,OCR, 機器翻譯等應用技術。既有基於預訓練模型finetune的多種任務模型(作詩,小說續寫),又有取得了VQA首次超人類,機器翻譯最佳論文等的業界領先技術,還涵蓋了包括通用,新聞,電商,醫療等多領域,中,英,法,西等10+語言的多語言模型。從模型深度,廣度,學術界資料集到應用場景,都提供了豐富易用,效能領先的模型庫。

在智慧語音領域,社群覆蓋語音識別、語音合成、語音訊號處理、語音喚醒等語音領域最主流的能力,首批上線逾40個模型。其中,“UniASR語音識別通用領域模型”阿里雲語音識別API背後的模型,這次透過魔搭社群免費開放,這種開放公共雲背後的演算法模型的做法在業界尚屬首例。開發者可基於該模型,透過領域資料finetune進一步增強垂直領域語音識別準確率。“SAMBERT高表現力多情感語音合成模型”同樣是阿里雲語音合成API背後的演算法模型。達摩院還同步開源了SAMBERT模型訓練程式碼和流程。透過魔搭社群開放,任何有高品質錄音資料的模型開發者均可製作出與達摩院同樣品質的語音合成音色。“Paraformer語音識別模型”是達摩院下一代非自迴歸端到端語音識別模型,剛剛於InterSpeech-2022發表,即已透過魔搭分享給業界。Paraformer是當前學術界在非自迴歸技術路線上研究探索的SOTA模型之一。模型結構先進,相比自迴歸模型在保持精度的同時,在推理效率上最高能達到10倍提升,將有效降低語音識別線上服務的成本。

在多模態領域(所謂多模態模型,就是跨越文字、影象、聲音等多種資料型別之間的理解和生成問題,人處理任務通常也是以多模態的方式進行。),魔搭社群這次也提供了豐富的多模態模型矩陣。它不僅包含了不同型別的圖文多模態預訓練模型,比如我們提供了一個原生CLIP模型的中文版,以及像OFA/Team/mPLUG這樣自研的多模態預訓練模型;同時魔搭也包含了使用這類模型建立的包括影象描述、視覺定位、視覺問答、圖文檢索等各類多模態典型任務。(另外,為了滿足不同部署條件的開發者,我們很多模型都有不同規模的版本可供選擇。社群同樣也可以很方便的在這些預訓練模型,或者他們的下游模型上進行二次開發。)

此外,社群還在AI for Science等新領域積極拓展,深勢科技在社群開源了蛋白質摺疊預測模型和3D分子模型。

魔搭社群的使用優勢

魔搭社群提供模型的索引和發現功能,AI模型都有自己的標籤和相應的索引,讓不同的模型使用者,能夠根據自己的需求,快速的找到相應的模型。每個模型都配套一個詳細的模型的卡片來描述模型背後的機理,以及相關的一些文獻。

魔搭社群也提供線上體驗的能力,能夠讓眾多使用者能夠快速的在不開發程式碼的情況下,去體驗各種模型的效果。社群還提供相關的模型開發的程式碼,引導社群的開發者以程式設計的方式,結合社群的python library,快速使用模型。除了模型以外,社群同時還提供了豐富的資料集。幫助模型進行訓練和調優。而社群分享頻道,方便模型的使用者和開發者能夠方便的交流心得和體會,推動模型的應用。

ModelScope魔搭社群覆蓋全頻譜的使用/開發者

為了構建這些完整的平臺體驗,魔搭提供了一個功能強大的開源Python package,package提供了不同模型接入魔搭生態的介面和實現,底層能夠相容各種機器學習框架,無縫銜接模型應用與開發。只需要import對應的python package,透過簡單的一行程式碼,就可以完成模型的發現,模型的自動下載,以及模型的載入和使用。在體驗過模型後,還可以方便的一站式的部署到雲端,供APP使用。

技術架構圖

模型的開發離不開算力,魔搭社群的生態和雲的生態實現了無縫的整合。阿里云為魔搭社群提供了一定的免費的算力,來促進社群的快速發展。同時魔搭社群和多種雲產品結合,如阿里雲彈性加速計算EAIS和機器學習平臺PAI,覆蓋了模型的開發的方方面面。從魔搭社群,使用者們可以進行開發,並能夠快速的連線到雲生態。能夠完善今天整個模型的開發的鏈路。

值得注意的是,魔搭社群堅持開源開放,框架相容各種機器學習的框架,透過這樣的方式,不僅阿里巴巴各個團隊的模型都可以輕鬆的接入社群,同時外部的科技公司和高校也可以透過這樣的方式,快速接入各種模型。

炒股開戶享福利,入金抽188元紅包,100%中獎!

開啟App看更多精彩內容

上一篇:年底前必須『低調行事』才會順利星座點名
下一篇:存與不存養老錢,晚年生活有區別嗎?不妨聽聽這兩位老人的心裡話