投資 >

成本差異鑄成AI鴻溝？牛津：漢語訓(xùn)練費用是英語的2倍

2023-07-31 16:07:49 來源：金融界

【資料圖】

如今的大型語言模型（LLM）可以理解世界上很多語言，甚至是一些記載較少的語言。不過，大模型處理不同語言之間時，其性能上存在很大的差異，這是由于模型成本與其所訓(xùn)練的語言緊密掛鉤。

牛津大學(xué)最近進(jìn)行的一項研究表明，從諸多語言模型的計費方式看，英語的輸入和輸出比其他語言的輸入和輸出要便宜得多。例如，西班牙語的成本約為英語的1.5倍，簡體中文的價格約為2倍以上，緬甸撣語在15倍以上。

成本的差異也間接導(dǎo)致英語使用者和世界其他語言使用者之間形成AI鴻溝。

成本差異主要是因數(shù)據(jù)標(biāo)記化所帶來的。標(biāo)記化就是將訓(xùn)練文本分解成更小的單元，這個更小的單元就是標(biāo)記（Token）。這是一個人工智能（AI）公司將用戶輸入轉(zhuǎn)換為計算成本的過程。

研究顯示，使用英語以外的語言訪問和訓(xùn)練模型的成本都更高。例如中文，無論是在語法上還是在字符數(shù)量上，都有更復(fù)雜的結(jié)構(gòu)，從而導(dǎo)致更高的標(biāo)記化（Token）率。

舉例來看，基于OpenAI公司的GPT2模型，對于“國家不同，所得稅的結(jié)構(gòu)是不同的，稅率和稅率等級也有很大的差異”這句話的處理來看，在簡體中文處理中運用到了66個Token，在英語處理中僅用到了24個Token，而在禪語處理中使用到了468個Token。

就每次輸出所需的費用而言，漢語的成本是英語的兩倍。所以在AI相關(guān)的費用中，英語的成本效益是最高的。

當(dāng)涉及到語言模型時，設(shè)計者的主要目標(biāo)是實現(xiàn)低成本和高效功能之間的平衡。隨著AI領(lǐng)域的不斷發(fā)展，科技公司必須仔細(xì)考慮語言選擇對成本和可訪問性的影響。

這種成本差異促使中國、印度等國家紛紛開發(fā)自己的母語LLM項目。

本文源自：金融界

標(biāo)簽：

上一篇： 農(nóng)業(yè)農(nóng)村部：7月31日全國農(nóng)產(chǎn)品批發(fā)市場豬肉平均價格為20.81元/公斤比上周五上升4.8%
下一篇： 最后一頁

相關(guān)閱讀

成本差異鑄成AI鴻溝？牛津：漢語訓(xùn)練費用是

投資

如今的大型語言模型（LLM）可以理解世界上很多語言，甚至是一些記載較

2023-07-31

農(nóng)業(yè)農(nóng)村部：7月31日全國農(nóng)產(chǎn)品批發(fā)市場豬

投資

據(jù)農(nóng)業(yè)農(nóng)村部監(jiān)測，7月31日"農(nóng)產(chǎn)品批發(fā)價格200指數(shù)"為118 36，比上周五

2023-07-31

專訪中手游冼漢迪：IP是一種文化標(biāo)簽，其背

投資

在經(jīng)歷2022年的營收下滑后，2023年中國游戲市場漸趨回暖，但在獲客成本

2023-07-31

北京發(fā)布分區(qū)暴雨紅色預(yù)警，部分地區(qū)降級發(fā)

投資

北京市氣象局消息，本市強降雨持續(xù)，北京市氣象臺發(fā)布分區(qū)域暴雨紅色預(yù)

2023-07-31

日本全國平均最低時薪將首超1000日元

投資

據(jù)日經(jīng)中文網(wǎng)，日本中央最低工資審議會（厚生勞動相的咨詢機構(gòu)）日前決

2023-07-31

精彩閱讀財富科技金融快訊企業(yè)

成本差異鑄成AI鴻溝？牛津：漢語訓(xùn)練費用是英語的2倍

投資

如今的大型語言模型（LLM）可以理解世界上很多語言，甚至是一些記載較

2023-07-31

農(nóng)業(yè)農(nóng)村部：7月31日全國農(nóng)產(chǎn)品批發(fā)市場豬肉平均價格為20.81元/公斤比上周五上升4.8%

投資

據(jù)農(nóng)業(yè)農(nóng)村部監(jiān)測，7月31日"農(nóng)產(chǎn)品批發(fā)價格200指數(shù)"為118 36，比上周五

2023-07-31

專訪中手游冼漢迪：IP是一種文化標(biāo)簽，其背后是受眾群體的文化認(rèn)同

投資

在經(jīng)歷2022年的營收下滑后，2023年中國游戲市場漸趨回暖，但在獲客成本

2023-07-31

北京發(fā)布分區(qū)暴雨紅色預(yù)警，部分地區(qū)降級發(fā)布暴雨橙色預(yù)警

投資

北京市氣象局消息，本市強降雨持續(xù)，北京市氣象臺發(fā)布分區(qū)域暴雨紅色預(yù)

2023-07-31

日本全國平均最低時薪將首超1000日元

投資

據(jù)日經(jīng)中文網(wǎng)，日本中央最低工資審議會（厚生勞動相的咨詢機構(gòu)）日前決

2023-07-31

高盛：油市轉(zhuǎn)向供應(yīng)短缺明年二季度油價將升至93美元

投資

智通財經(jīng)APP獲悉，“大宗商品旗手”高盛表示，市場已經(jīng)擺脫了對增長的

2023-07-31

A股零售板塊午后持續(xù)拉升走強中央商場、國芳集團漲停

投資

7月31日，A股零售板塊午后持續(xù)拉升走強，通程控股、中央商場午后雙雙漲

2023-07-31

周茂華：7月制造業(yè)市場需求和景氣度改善，國內(nèi)物價有望企穩(wěn)回升

投資

國家統(tǒng)計局31日發(fā)布2023年7月中國采購經(jīng)理指數(shù)運行情況顯示，7月份，制

2023-07-31

上海第二批供地下半場將于8月1日起拍 9宗地、總起價220億元

投資

悉，此次交易包含9幅涉宅地塊，起始總價達(dá)220 23億元，現(xiàn)場交易會將在2

2023-07-31

民銀研究：7月非制造業(yè)景氣度回落至年內(nèi)最低水平，制造業(yè)景氣度則持續(xù)改善

投資

7月非制造業(yè)景氣度回落至年內(nèi)最低水平，制造業(yè)景氣度則持續(xù)改善。

成本差異鑄成AI鴻溝？牛津：漢語訓(xùn)練費用是英語的2倍

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

網(wǎng)站介紹