產品趨勢:四大批次備案境內深度學習算法及公司一覽

0 評論 1364 瀏覽 1 收藏 11 分鐘

隨著人工智能賽道的火熱,監管方面的相關工作也在不斷推進中。本文總結了四大批次備案境內深度學習算法及公司一覽,供你參考。

2024年3月,人工智能賽道上,中美印歐等國家和地區在監管探索方面展現出不同策略。而在我國,隨著一系列監管方案的出臺,境內深度學習算法的備案工作也在有序推進。

梳理了網信辦《境內深度合成服務算法備案清單》四份備案材料,統計一共涉及了326項算法備案,包括2023年6月、2023年8月、2024年1月、2024年2月的備案清單,以及最后的3項補充備案。

一、哪個細分賽道的深度合成算法玩家最多?最卷?

在深度合成算法領域,幾類算法因其廣泛的應用和實用性而備受歡迎。這些算法包括文本生成算法、圖像生成算法、語音生成算法、視頻生成算法、數字人生成算法、代碼生成算法以及音頻生成算法。

1. 文本生成算法:主要用途包括智能對話、知識問答、文章寫作、機器翻譯等

  • 智譜ChatGLM生成算法 (北京智譜華章科技有限公司)
  • 百度PLATO大模型算法 (北京百度網訊科技有限公司)
  • 小冰語言模型算法 (北京紅棉小冰科技有限公司)

比如,智譜ChatGLM生成算法的準確性不亞于GPT3.5,同時集成了文生圖、智能對話、數據分析等。測試下來,智譜的長文本解讀功能真的強悍,支持不超過30M的PDF文件解讀,準確率極高,期待開放更多doc等格式。但文生圖、數據分析功能并不好用。舉個例子,其中文生圖的promote語句“不帶眼鏡”但生成的圖像基本都帶有眼鏡、數據分析只能支持平均數、中文數等分析。

智譜并不是一個熟悉的AI公司,但其背后卻是互聯網資本。早在2023年的8月和9月,阿里巴巴旗下的螞蟻集團與阿里云戰投相繼參與了對智譜AI的融資,分別投入了4.4億元和12億元,助力其B輪次的融資。此外,這一輪融資還吸引了順為、小米、紅杉、高瓴、騰訊等眾多知名投資方的加入,形成了豪華的投資陣容。

2. 圖像生成算法:主要用途涵蓋虛擬試衣、虛擬裝修、虛擬形象、表情特效、圖片編輯等

  • 百度文生圖內容生成算法(北京百度網訊科技有限公司)
  • 商湯秒畫內容生成算法(上海商湯智能科技有限公司)
  • 商湯格物高精度重建算法(上海商湯智能科技有限公司)

本月商湯系的MiniMax剛獲得阿里巴巴的領投,根據彭博社的消息,新一輪融資完成后,MiniMax的估值將超25億美元(約合人民幣180億)。

MiniMax自主研發的AI聊天應用Glow允許用戶親手“塑造”出個性化的AI智能體,無論是理想的戀人還是親密的朋友,用戶都可以根據自己的喜好為其取名,并設定獨特的人設、性格和愛好。通過與這些AI智能體的內容生成和用戶反饋機制,用戶可以進行自然而流暢的溝通交流。據媒體報道,Glow自上線以來僅短短4個月時間,用戶數量便迅速逼近500萬,展現出強大的市場潛力和用戶吸引力。

3. 語音生成算法主要用途包括文本轉語音、語音合成、歌聲合成等

  • 百度語音合成算法(北京百度網訊科技有限公司)
  • 達摩院語音合成算法(阿里巴巴達摩院(杭州)科技有限公司)
  • 訊飛語音合成算法(科大訊飛股份有限公司)

語音生成算法在文本轉語音、語音合成和歌聲合成等方面具有廣泛應用,為語音交互和語音內容創作提供了可能。我使用最多的是飛書妙記的語音轉文字,相比onenote插件僅支持繁體字、騰訊會議的ai錄屏等,飛書妙記的網頁版非常方便、不容易斷續且文本翻譯質量非常高。

此外,字節在剪映等視頻剪輯軟件中的變聲、文字轉語音等應用也非常使用且場景豐富。

4. 視頻生成算法:主要用途包括虛擬數字人、視頻換臉、視頻風格轉換等

  • 百度數字人驅動算法(北京百度網訊科技有限公司)
  • 商湯2D數字人合成算法(上海商湯智能科技有限公司)
  • 騰訊云數字人形象合成算法(深圳市騰訊計算機系統有限公司)

騰訊云、火山引擎B端定制數字人的價格是6000+/個,但通用版其實基本免費,這類IP類的落地和使用也較多。應用場景比如說金融行業:銀行、保險、證券等,證券分析師、保險代理人等觸客一線的專業人士可以利用數字人進行溝通產出,我們公司已在使用。此外自媒體等ip產出也較多,例如財經類大V等視頻其實并不是本人,而是MCN機構量產的數字人。

5. 代碼生成算法:主要用途包括代碼自動生成、代碼翻譯等

  • 商湯AI代碼生成算法(上海商湯智能科技有限公司)
  • 商湯AI代碼生成算法-1(上海商湯智能科技有限公司)

我們公司已在推廣使用代碼助手,看了一眼推特上STEVEN HONG利用AI發布的代碼問答非常專業,理解后續能解放雙手、釋放效率也非常棒。

6. 音頻生成算法:主要用途包括語音合成、歌聲合成等

  • 快音音色提取和歌聲合成算法(成都開心音符科技有限公司)
  • 小冰歌聲合成服務算法(北京紅棉小冰科技有限公司)
  • 唱鴨文字生成音樂算法(廣州歡城文化傳媒有限公司)

二、主要玩家是哪些?

就備案數量而言,深度合成算法領域,國內的主要玩家包括北京百度網訊科技有限公司、上海商湯智能科技有限公司和北京紅棉小冰科技有限公司。

北京百度網訊科技有限公司以19次的出現次數高居榜首,顯示了其在深度合成算法領域的廣泛布局和強大實力。百度在文本生成、圖像生成、語音生成、視頻生成、數字人生成等多個領域均有突出的算法表現,如百度PLATO大模型算法、百度文生圖內容生成算法、百度語音合成算法以及百度數字人驅動算法等。

上海商湯智能科技有限公司以12次的出現次數緊隨其后,其在圖像生成、代碼生成等領域擁有強大的技術實力。商湯的秒畫內容生成算法、格物高精度重建算法以及AI代碼生成算法等,都展現了其在深度合成算法領域的創新能力和應用潛力。

北京紅棉小冰科技有限公司以7次的出現次數位列第三,其在語言模型、數字人生成和音頻生成等領域有著不俗的表現。小冰語言模型算法、數字人合成算法以及歌聲合成服務算法等,都體現了小冰在人工智能領域的深厚積累和獨特優勢。紅棉小冰前身為微軟(亞洲)互聯網工程院人工智能小冰團隊,是微軟全球最大的人工智能獨立產品研發團隊,該團隊于2013年12月在中國組建。

三、第一批次到第四批次發生了哪些變化?

在2023年6月至2024年2月期間,深度合成服務算法備案清單展現出了明顯的變化趨勢。

首先,備案數量呈現出持續增長的趨勢。從2023年6月的41個備案算法,到2024年2月的255個,備案數量在短短幾個月內實現了大幅提升。這反映出深度合成技術在我國的快速發展和廣泛應用,同時也體現了監管部門對于該領域日益嚴格的監管要求。

其次,各類算法的備案數量也呈現出不同的增長態勢。文本生成類算法的增長尤為明顯,從2023年6月的較低占比增長到2024年2月的超過50%。這表明文本生成技術在自然語言處理、智能問答、內容創作等領域的應用正在不斷深化和拓展。同時,圖像生成、語音生成、視頻生成、數字人生成、代碼生成和音頻生成等類型的算法也都有不同程度的增長,反映了深度合成技術在多個領域的全面發展。

最后放鏈接《國家互聯網信息辦公室關于發布第四批深度合成服務算法備案信息的公告》https://www.cac.gov.cn/2024-02/18/c_1709925427424332.htm

本文由 @AI營銷先鋒派 原創發布于人人都是產品經理。未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!