AI賦能影像技術讓修圖小白秒變大師 提升攝影修圖效率

2022-04-15 10:18:55   來源:科技日報

日,計算機視覺頂級會議CVPR 2022公布了會議錄取結果,美圖影像研究院(MT Lab)與北京航空航天大學可樂實驗室聯(lián)合發(fā)表的論文被接收。該論文突破地提出分布感知式單階段模型(DAS),用于解決極具挑戰(zhàn)的多人3D人體姿態(tài)估計問題。該方法通過一次網(wǎng)絡前向推理同時獲取3D空間中人體位置信息以及相對應的關鍵點信息,從而簡化了預測流程,提高了效率。此外,該方法有效地學了人體關鍵點的真實分布,進而提升了基于回歸框架的多人3D人體姿態(tài)估計方法的精度。

實際上,這只是美圖利用人工智能為影像技術賦能的冰山一角。早在2010年,美圖就成立了核心研發(fā)部門——美圖影像研究院,該研究院致力于計算機視覺、機器學、增強現(xiàn)實等人工智能(AI)相關領域的研發(fā),在人臉技術、人體技術、圖像分割、圖像識別、圖像生成、圖像增強等方面處于領先水,為美圖現(xiàn)有和未來的產(chǎn)品提供核心算法支持,并通過前沿技術推動美圖產(chǎn)品發(fā)展,曾先后多次參與CVPR、ICCV、ECCV等計算機視覺國際頂級會議,并斬獲冠亞軍10余項,被稱為美圖的“技術中樞”。

高效精準獲取多人3D人體姿態(tài)估計結果

計算機視覺中的經(jīng)典技術——多人3D人體姿態(tài)估計在AR/VR、游戲、運動分析、虛擬試衣等領域具有廣泛的應用潛力,年來隨著元宇宙概念的興起,更是讓這一技術備受關注。

目前,通常采用兩階段方法來解決多人3D人體姿態(tài)估計的問題:自頂向下方法,即先檢測圖片多個人體的位置,之后對檢測到的每個人使用單人3D姿態(tài)估計模型來分別預測其姿態(tài);自底向上方法,即先檢測圖片中所有人的3D關鍵點,之后通過相關將這些關鍵點分配給對應的人體。

盡管兩階段方法取得了良好的精度,但是需要通過冗余的計算和復雜的后處理來順序地獲取人體位置信息和關鍵點位置信息,其速率通常難以滿足實際場景需求,因此多人3D姿態(tài)估計算法流程亟須簡化。

為了克服兩階段方法存在的問題,該論文提出了一種分布感知式單階段模型用于解決基于單張圖片的多人3D人體姿態(tài)估計問題。另外,DAS在優(yōu)化過程中對3D關鍵點的分布進行學,這為3D關鍵點的回歸提供了極具價值的指導信息,從而有效地提升了預測精度。

此外,為了緩解關鍵點分布估計的難度,DAS采用了一種迭代更新策略以逐步逼真實分布目標,通過這樣一種方式,DAS可以高效且精準地從單目RGB圖片中一次獲取多個人的3D人體姿態(tài)估計結果。

與已有的兩階段方法相比,該模型可以通過一次網(wǎng)絡前向推理同時獲取人體位置信息以及所對應的人體關鍵點位置信息,從而有效地簡化預測流程,克服了已有方法在高計算成本和高模型復雜度方面的弊端。另外,該方法成功將標準化流引進到多人3D人體姿態(tài)估計任務中,以在訓練過程中學人體關鍵點分布,并提出迭代回歸策略緩解分布學難度,來達到逐步逼目標的目的。通過該模型可以獲取數(shù)據(jù)的真實分布,有效地提升模型的回歸預測精度。

人工智能技術大大提升攝影修圖效率

對人臉皮膚進行精細化的瑕疵修復與暗沉祛除,一鍵入“齒”修復牙齒上的瑕疵,照片上模糊的容顏清晰重現(xiàn),全身美型告別大粗腿、水桶腰……AI技術正讓修圖小白秒變大師。

一家商業(yè)攝影機構的業(yè)務流程基本包括:營銷獲客、攝影服務、后期處理、成品制作等環(huán)節(jié)。其中,后期修圖是商業(yè)攝影工作流程中占比高、耗時長、工作量大的一個環(huán)節(jié)。

在旺季或者拍攝任務激增時,從拍攝到出片的周期甚至長達1個月左右。尤其是在人像處理部分,非常考驗修圖師的專業(yè)功底,而一名合格修圖師的培養(yǎng)需要耗費高昂的人力、物力成本,還需要面臨人員頻繁流動的風險。

美圖創(chuàng)始人兼首席執(zhí)行官吳欣鴻在接受科技日報記者采訪時表示,據(jù)不完全統(tǒng)計,商業(yè)攝影1年修圖可達120億張,大量繁雜的重復勞動以及較高的技術門檻,給商業(yè)影樓帶來巨大的成本壓力。借助AI技術完成重復繁雜的后期初修工作,不僅能夠提升商業(yè)攝影后期的修圖效率,同時也為商業(yè)攝影行業(yè)提供了深度融合美學藝術的專業(yè)級圖像處理服務。

由美圖技術大腦——美圖影像研究院自主研發(fā)的美圖云修,通過智能預設功能,一鍵即可完成對照片的批量處理。其中,臉部優(yōu)化功能可以修復面部瑕疵,打造細膩肌膚;妝容調(diào)整功能可實現(xiàn)對妝容的智能調(diào)節(jié)。此外,美圖云修還能夠完成塑造立體的面部五官、分區(qū)域?qū)崿F(xiàn)全身美型、美化身體肌膚等80余項修圖工作。同時,靈活自由的參數(shù)自定義也滿足了用戶對修圖更專業(yè)的需求。

“美圖云修還提供濾鏡特效、牙齒修復、祛雙下巴、勻膚、縮頭、一鍵仿妝、背景增強、多人全身美型等獨特功能,可以幫助影樓快速完成約80%的精修工作。”美圖技術副總裁、美圖影像研究院負責人劉洛麒表示。

我國影像軟件技術攜手AI大步向前

今年3月30日,美圖披露2021年全年業(yè)績報告。報告顯示,2021年美圖研發(fā)投入達5.455億元,同比2020年增長35%。

隨著中國影像軟件產(chǎn)業(yè)對技術研發(fā)投入的不斷加大,年來中國影像軟件在技術能力方面有了很大的進展,有些已經(jīng)不輸國外同類產(chǎn)品。

“我們推出的視頻美顏App——Wink,它的視頻人像美化功能需要將人像美顏從圖像擴展到視頻維度,這就需要實時的人臉檢測跟蹤、分割、3D建模等技術與人像美顏算法進行有機結合,同時還要應對視頻抖動、大側臉等極端情況,才能為用戶提供滿意的結果。”劉洛麒說。

“用戶拍攝的照片或視頻存在清晰度低、畫質(zhì)差、產(chǎn)生噪點等問題,我們利用基于深度學的畫質(zhì)增強技術能夠提高用戶照片與視頻的質(zhì)量,滿足他們的拍攝需求。同時,我們也將深度學應用到人像美顏中,例如我們自主研發(fā)的AI勻膚技術,既能祛除臉部瑕疵,同時也保留了細膩的皮膚紋理質(zhì)感。”吳欣鴻說。

“我們基于AI研發(fā)的人體美型技術,不是簡單地對人體進行拉伸,而是先結合人體3D重建、人體分割等技術去建立人體的三維模型,再利用深度學算法學美化之后的人體模型形變,同時對背景的Mesh(網(wǎng)格)進行建模,從而緩解背景的變形扭曲,最終實現(xiàn)用戶滿意的人體美型效果。”劉洛麒指出。

此外,美圖證件照應用到的人像摳圖技術,可以實現(xiàn)發(fā)絲級的精細摳圖,完成對證件照人像的一鍵換裝,同時保持人像和背景的光線和諧。而基于AI生成的增發(fā)技術,可以調(diào)整發(fā)際線,可以改變發(fā)色和發(fā)型,還能使頭發(fā)顯得更蓬松。

未來,人工智能將如何賦能影像技術?對此,吳欣鴻表示,一方面,基于人工智能的影像技術,將與各行各業(yè)有更多、更深入的結合,這也對影像技術提出了更高的要求。另一方面,通過3D技術和AR技術等,為用戶提供沉浸式和可交互的虛擬化體驗也是未來影像技術發(fā)展的熱門方向。

標簽: AI賦能 影像技術 修圖小白 秒變大師 攝影修圖效率

相關閱讀

AI賦能影像技術讓修圖小白秒變大師 提升攝

科技

近日,計算機視覺頂級會議CVPR 2022公布了會議錄取結果,美圖影像研究院(MT Lab)與北京航空航天大學可樂實驗室聯(lián)合發(fā)表的論文被接收。該

2022-04-15

醫(yī)生新發(fā)現(xiàn):普通X片可預測股骨頭壞死的塌

科技

13日,記者從廣州中醫(yī)藥大學第三附屬醫(yī)院(廣東省中醫(yī)骨傷研究院)獲悉,該院首席教授、主任中醫(yī)師何偉團隊的最新研究成果近日刊發(fā)在國際骨科

2022-04-14

對大腦中每個細胞成像 美國“腦計劃”擬繪

科技

據(jù)美國哥倫比亞大學官網(wǎng)近日報道,該大學和西奈山伊坎醫(yī)學院研究人員正在開展一個項目,該項目將生成整個人類大腦及其所有1800多億個細胞的

2022-04-14

研究發(fā)現(xiàn):神奇蘑菇化合物能“打開”抑郁癥

科技

賽洛西賓是一種在神奇蘑菇中發(fā)現(xiàn)的迷幻化合物。英國《自然·醫(yī)學》雜志11日發(fā)表的一項研究發(fā)現(xiàn),賽洛西賓有助于打開抑郁癥患者的大腦,使大

2022-04-14

科學家:蛋白增強因子α可調(diào)節(jié)體重 有望為

科技

美國耶魯大學科學家在4月11日出版的《美國國家科學院院刊》上發(fā)表論文稱,一種被稱為增強因子α的蛋白可調(diào)節(jié)小鼠體重,這一發(fā)現(xiàn)有望為

2022-04-14

AI賦能影像技術讓修圖小白秒變大師 提升攝影修圖效率

科技

近日,計算機視覺頂級會議CVPR 2022公布了會議錄取結果,美圖影像研究院(MT Lab)與北京航空航天大學可樂實驗室聯(lián)合發(fā)表的論文被接收。該

2022-04-15

醫(yī)生新發(fā)現(xiàn):普通X片可預測股骨頭壞死的塌陷 提高塌陷的診斷率

科技

13日,記者從廣州中醫(yī)藥大學第三附屬醫(yī)院(廣東省中醫(yī)骨傷研究院)獲悉,該院首席教授、主任中醫(yī)師何偉團隊的最新研究成果近日刊發(fā)在國際骨科

2022-04-14

對大腦中每個細胞成像 美國“腦計劃”擬繪人腦細胞多樣性圖集

科技

據(jù)美國哥倫比亞大學官網(wǎng)近日報道,該大學和西奈山伊坎醫(yī)學院研究人員正在開展一個項目,該項目將生成整個人類大腦及其所有1800多億個細胞的

2022-04-14

研究發(fā)現(xiàn):神奇蘑菇化合物能“打開”抑郁癥患者大腦

科技

賽洛西賓是一種在神奇蘑菇中發(fā)現(xiàn)的迷幻化合物。英國《自然·醫(yī)學》雜志11日發(fā)表的一項研究發(fā)現(xiàn),賽洛西賓有助于打開抑郁癥患者的大腦,使大

2022-04-14

科學家:蛋白增強因子α可調(diào)節(jié)體重 有望為代謝紊亂帶來新療法

科技

美國耶魯大學科學家在4月11日出版的《美國國家科學院院刊》上發(fā)表論文稱,一種被稱為增強因子α的蛋白可調(diào)節(jié)小鼠體重,這一發(fā)現(xiàn)有望為

2022-04-14

研究人員:仙女星系中發(fā)現(xiàn)12顆大質(zhì)量物質(zhì)轉移雙星

科技

仙女星系是離銀河系最近的漩渦星系,也是本星系群中最大的星系。記者13日從中國科學院云南天文臺了解到,該臺研究人員在首次對仙女星系中的

2022-04-14

國產(chǎn)大型水陸兩棲飛機“鯤龍”AG600-1003架機首飛準備工作有序推進

科技

記者從中國航空工業(yè)集團有限公司12日召開的新聞發(fā)布會上獲悉,2022年一季度,AG600計劃中的鐵鳥試驗、靜力試驗、首飛安全性試驗及1003架機

2022-04-14

申報“科學家精神教育基地”需五項標準 4月20日截止

科技

近日,中國科協(xié)、教育部、科技部等七部門印發(fā)通知,在全社會開展科學家精神教育基地建設和服務管理工作。4月13日,中國科協(xié)新聞發(fā)布會上,

2022-04-14

人類造血干細胞發(fā)育首份“路線圖”創(chuàng)建 或有助于擴大血液疾病的治療選擇

科技

美國加州大學洛杉磯分校科學家創(chuàng)建了首份路線圖,使跟蹤人類胚胎中造血干細胞發(fā)育的每一步成為可能,為科學家提供了在實驗室生產(chǎn)全功能造血

2022-04-14

科學家利用回收稻殼創(chuàng)造了首臺硅量子點LED燈

科技

碾米從稻殼中分離出來,每年在全球范圍內(nèi)產(chǎn)生約1億噸稻殼廢料。日本科學家利用回收稻殼創(chuàng)造了首臺硅量子點LED燈,其以一種低成本、環(huán)保的方

2022-04-14

遇見旗袍是于萬千人群中的驚鴻一瞥 沿途灑滿了愛的芬芳

旗袍,中國和世界華人女性的傳統(tǒng)服裝,被譽為中國國粹和女性國服。雖然其定義和產(chǎn)生的時間至今還存有諸多爭議,但它仍然是中國悠久服飾文化

北京市電影院有序恢復開放 周五預售部分場次已滿座

7月21日,北京市政府發(fā)布《北京市電影局關于在疫情防控常態(tài)化條件下有序推進電影院恢復開放的通知》,宣布全市低風險地區(qū)影院,可于7月24日

近期持續(xù)強降雨影響 第46屆武漢渡江節(jié)因長江水位過高取消

?武漢7·16渡江節(jié)組委會14日發(fā)布公告,由于長江武漢關水位超警戒水位,按照規(guī)定取消2020年第46屆武漢7·16渡江節(jié)。受近期持續(xù)強降雨影響,

“非遺”普及受眾最看重“動手”參觀大師工作室非常享受

過去一段時間,國家級非遺項目灰塑傳承人邵成村,多次在陳家祠等工作現(xiàn)場,向身邊那些帶著好奇目光的人們講解灰塑的種種技術細節(jié):草根灰、

璧山冷酒夜市 豐富市民夜間文旅活動

7月13日,位于璧山區(qū)南門唐城夜市街區(qū)的璧山冷酒夜市開街。這是璧山區(qū)打造夜間經(jīng)濟消費載體、培育夜間經(jīng)濟活動品牌的舉措之一。璧山市民一

重啟上市公司資本運作 康佳集團去年半導體業(yè)務營業(yè)收入為3.22億元

近日,康佳集團正式對外發(fā)布2021年年度業(yè)績報告。2021年,康佳集團實現(xiàn)全年營收491 07億元,歸屬于母公司的凈利潤為9 05億元,同比增長89 5

偉祿集團連續(xù)6年增長 去年營收同比增長37.5%

深港通標的之一的深圳企業(yè)偉祿集團近日公布2021年業(yè)績。財報數(shù)據(jù)顯示,偉祿集團全年營業(yè)收入11 95億港元,同比增長37 5%,連續(xù)6年穩(wěn)步增長;

龍頭企業(yè)去年凈利倍增 整個行業(yè)營收規(guī)模有望創(chuàng)造歷史新高位

近日,面板龍頭TCL科技、京東方分別發(fā)布2021年度業(yè)績快報,兩家企業(yè)去年歸屬于上市公司股東的凈利潤分別增長129 3%、412 86%,實現(xiàn)超過百億

深圳國企全力為市民 守好“菜籃子”“米袋子”保障量足價穩(wěn)

疫情防控形勢下,民生物資供應是否充足成為市民最為關注的問題之一。連日來,深農(nóng)集團、深糧控股等企業(yè),充分發(fā)揮國企擔當,全力為深圳市民

去年我國中小企業(yè)實現(xiàn)恢復性增長 政策持續(xù)加碼助力中小企業(yè)平穩(wěn)發(fā)展

中小企業(yè)是穩(wěn)定工業(yè)經(jīng)濟的重要力量,黨中央把促進中小企業(yè)發(fā)展作為長期戰(zhàn)略。2021年我國中小企業(yè)實現(xiàn)了恢復性增長,規(guī)上中小企業(yè)收入利潤同

工銀瑞信累計創(chuàng)造投資回報4707億元 夯實投研能力建設

公募基金行業(yè)的本質(zhì)是受人之托,代人理財,首要社會責任就是為廣大投資者提供優(yōu)質(zhì)的資產(chǎn)管理服務。作為國內(nèi)首家銀行系基金公司,工銀瑞信始