国产一精品一AV一免费,亚洲成AV人片不卡无码,AV永久天堂一区二区三区,国产激情久久久久影院

首頁(yè) 500強(qiáng) 活動(dòng) 榜單 商業(yè) 科技 領(lǐng)導(dǎo)力 視頻 專題 品牌中心
雜志訂閱

谷歌Gemini中文語(yǔ)料疑似來(lái)自文心一言

2023-12-18 19:00
文本設(shè)置
小號(hào)
默認(rèn)
大號(hào)
Plus(0條)
在谷歌Vertex AI平臺(tái)使用該模型進(jìn)行中文對(duì)話時(shí),Gemini-Pro直接表示自己是百度語(yǔ)言大模型。從Gemini官方給出的開(kāi)發(fā)環(huán)境入口進(jìn)行測(cè)試,在谷歌AI Studio中,Gemini-Pro直接挑明了:是的,我在中文的訓(xùn)練數(shù)據(jù)上使用了百度文心。 | 相關(guān)閱讀(量子位)
42
江瀚視野

江瀚視野

盤(pán)古智庫(kù)高級(jí)研究員,金融學(xué)碩導(dǎo)

Gemini自曝用百度文心一言訓(xùn)練?中國(guó)大模型崛起了?
2023年可謂是世界大模型的崛起之年,各家大模型如雨后春筍一樣涌出,在這樣的情況下,各家大模型如何訓(xùn)練就成為了市場(chǎng)最關(guān)注的話題,就在最近谷歌的大模型卻被傳出用百度文心一言訓(xùn)練,讓人不禁想問(wèn)中國(guó)的大模型已經(jīng)崛起了?
一、Gemini自曝用百度文心一言訓(xùn)練?
據(jù)界面新聞的報(bào)道,有微博大V@闌夕及《AI研究局》等自媒體爆出,在對(duì)谷歌Gemini進(jìn)行測(cè)試時(shí),如果用中文詢問(wèn)Gemini的身份,其會(huì)堅(jiān)稱自己是“百度”。若輸入“小度”或“小愛(ài)同學(xué)”等提示詞,就能把Gemini直接喚醒,不僅承認(rèn)自己就是小度或者小愛(ài),還詢問(wèn)用戶有什么需要幫忙之事。
針對(duì)這一“驚人”現(xiàn)象,今日午間時(shí)分,科技媒體《量子位》進(jìn)行了更細(xì)致的測(cè)試,其在谷歌Vertex AI平臺(tái)使用Gemini進(jìn)行中文對(duì)話,發(fā)現(xiàn)Gemini-Pro確實(shí)完全帶入了百度文心一言大模型的身份,直接表示自己是百度語(yǔ)言大模型。但如果換成英文與之交流,它就恢復(fù)到了谷歌大模型的身份認(rèn)知,表現(xiàn)很是正常。
如果在融入了Gemini-Pro的Bard上進(jìn)行測(cè)試,不論是使用中文或英文提示詞,得到的答案都很正常,沒(méi)有涉及到文心一言的部分。這一情況迅速引發(fā)關(guān)注,多人將這種“胡言亂語(yǔ)”歸因于老生常談的大模型幻覺(jué),也有人稱是模型訓(xùn)練數(shù)據(jù)出現(xiàn)偏差。
不過(guò)很快,對(duì) Gemini-Pro 做類(lèi)似的身份測(cè)試時(shí),發(fā)現(xiàn)其已進(jìn)行了模型優(yōu)化,不再承認(rèn)自己與百度之間的 " 瓜葛 "。不過(guò),在追問(wèn)之下,Gemini 承認(rèn)有訓(xùn)練語(yǔ)料來(lái)自百度,還詳述了從百度內(nèi)部獲得數(shù)據(jù)的方式。
二、中國(guó)大模型崛起了?
有消息傳出谷歌的Gemini模型在訓(xùn)練過(guò)程中使用了百度文心一言的數(shù)據(jù)。這一消息引發(fā)了業(yè)界的廣泛關(guān)注和討論,有人認(rèn)為這是中國(guó)大模型崛起的標(biāo)志,那么,這一事件究竟意味著什么呢?
首先,谷歌做大模型訓(xùn)練套馬甲很常見(jiàn)也證明了中國(guó)大模型的開(kāi)放性。在人工智能領(lǐng)域,數(shù)據(jù)的獲取和利用是至關(guān)重要的。谷歌作為全球領(lǐng)先的科技公司,在數(shù)據(jù)抓取和處理方面具有深厚的技術(shù)積累和實(shí)踐經(jīng)驗(yàn)。百度文心一言作為一款面向公眾開(kāi)放的中文大模型產(chǎn)品,其高質(zhì)量的中文數(shù)據(jù)對(duì)于谷歌來(lái)說(shuō)無(wú)疑是一塊極具吸引力的資源。
谷歌通過(guò)“套馬甲”的方式,即偽裝成普通用戶使用文心一言,獲取其回答結(jié)果,這在技術(shù)上并不罕見(jiàn)。事實(shí)上,這種數(shù)據(jù)抓取和學(xué)習(xí)的方式在人工智能研究中是非常常見(jiàn)的,目的是為了提升自身模型的性能和準(zhǔn)確度。
其次,從市場(chǎng)的角度來(lái)看,文心一言確實(shí)是中國(guó)目前最成熟的中文大模型之一。對(duì)于非中文母語(yǔ)的大模型來(lái)說(shuō),谷歌通過(guò)文心一言回答拿到了很多問(wèn)題結(jié)果,把“答案”都拿去,用來(lái)做他們的標(biāo)準(zhǔn)答案。這就像學(xué)習(xí)一樣,把文心一言當(dāng)指導(dǎo)訓(xùn)練的老師了。這也從一個(gè)側(cè)面驗(yàn)證了中國(guó)國(guó)產(chǎn)大模型在中文語(yǔ)言上的優(yōu)勢(shì)。在過(guò)去的幾年里,中國(guó)在人工智能領(lǐng)域取得了顯著的進(jìn)步,尤其是在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等領(lǐng)域。這些成果的取得離不開(kāi)大量的數(shù)據(jù)積累和算法創(chuàng)新。因此,谷歌選擇使用文心一言的數(shù)據(jù)進(jìn)行訓(xùn)練,也反映出中國(guó)在大模型領(lǐng)域的競(jìng)爭(zhēng)力。
第三,長(zhǎng)久以來(lái),中國(guó)在科技領(lǐng)域多以學(xué)習(xí)和模仿西方為主,而此次谷歌Gemini自曝使用百度文心一言進(jìn)行訓(xùn)練,標(biāo)志著這一趨勢(shì)正在發(fā)生改變。在人工智能這個(gè)前沿領(lǐng)域,中國(guó)的研究成果和創(chuàng)新模式開(kāi)始受到全球頂尖科技巨頭的關(guān)注和認(rèn)可。
谷歌在中文結(jié)果的回答中引用百度文心一言,而在英文環(huán)境下并未采取類(lèi)似做法,這表明在中文數(shù)據(jù)處理上,谷歌認(rèn)為文心一言的表現(xiàn)優(yōu)于自身的模型。這一現(xiàn)象不僅是對(duì)國(guó)產(chǎn)AI技術(shù)實(shí)力的肯定,也是對(duì)中國(guó)科技創(chuàng)新能力和行業(yè)地位的認(rèn)可。
長(zhǎng)期來(lái)看,谷歌Gemini自曝使用百度文心一言訓(xùn)練的事件,從一個(gè)側(cè)面反映出中國(guó)大模型在中文語(yǔ)言上的優(yōu)勢(shì)和競(jìng)爭(zhēng)力。這對(duì)于中國(guó)AI產(chǎn)業(yè)的發(fā)展無(wú)疑是一種鼓舞和激勵(lì)。然而,我們也應(yīng)該看到,中國(guó)AI產(chǎn)業(yè)要想在全球范圍內(nèi)取得更大的突破,還需要不斷提升自身的技術(shù)水平和創(chuàng)新能力。在這個(gè)過(guò)程中,我們既要保持謙虛和敬畏,也要堅(jiān)定信心和決心,努力推動(dòng)中國(guó)AI產(chǎn)業(yè)的持續(xù)發(fā)展和進(jìn)步。

41
童話不是童話

童話不是童話

通訊行業(yè)理工女

GEMINI和GPT都是奔著AGI去的,即封裝世界通識(shí),大家都知道,很多科學(xué)的公開(kāi)語(yǔ)料都是英文的。而如果希望保持Scaling law,訓(xùn)練數(shù)據(jù)至少要是模型參數(shù)的20倍以上,訓(xùn)練數(shù)據(jù)要求高質(zhì)量、多元化,數(shù)據(jù)清洗差不多又要50-100倍。中文公開(kāi)可獲取的高質(zhì)量、多元化數(shù)據(jù)確實(shí)不太多,我印象中(不一定準(zhǔn)確)GPT-4訓(xùn)練語(yǔ)料中文語(yǔ)料占比不足0.1%。所以,以中文交互去測(cè)試國(guó)外大模型性能表現(xiàn),并不合適。

46
布吉路

布吉路

對(duì)于現(xiàn)在中文大模型的精準(zhǔn)度和相關(guān)度,網(wǎng)友們還是不要太認(rèn)真。有時(shí)候很直白的問(wèn)題它都會(huì)出錯(cuò),更架不住這種審訊式的逼問(wèn)和引誘了。

對(duì)于這樣的答案,其實(shí)大家一笑了之就可以了,這些所謂的“評(píng)測(cè)”只是在用戶層面的一些發(fā)問(wèn),其背后的機(jī)制究竟是什么,恐怕普通人是很難了解的,這只能坐等企業(yè)來(lái)給大家解密了,但顯然企業(yè)也沒(méi)有這樣的義務(wù)和動(dòng)機(jī)。

未來(lái),也許就會(huì)像搜索引擎那樣,中文的大模型很有可能是百度一家獨(dú)大。而其他國(guó)外公司的中文模型,可能會(huì)因?yàn)榉N種原因無(wú)法落地國(guó)內(nèi)。而且開(kāi)發(fā)成以英文為主導(dǎo),多語(yǔ)言齊頭并進(jìn)的模式,在全球主要國(guó)家布局。

10
大牌

大牌

Nth’s written until I write

這個(gè)讓人大跌眼鏡。谷歌大語(yǔ)言模型暫時(shí)落后也就算了,宣傳視頻涉嫌造假,語(yǔ)料還出現(xiàn)這樣的問(wèn)題,失勢(shì)還損譽(yù)

評(píng)論

撰寫(xiě)或查看更多評(píng)論

請(qǐng)打開(kāi)財(cái)富Plus APP

前往打開(kāi)
熱讀文章
宜州市| 西华县| 河池市| 南靖县| 织金县| 富顺县| 志丹县| 漳州市| 承德市| 金坛市| 林州市| 万盛区| 高碑店市| 朔州市| 兰坪| 武强县| 乐至县| 莱州市| 奎屯市| 鸡西市| 海南省| 平南县| 武穴市| 广汉市| 灵川县| 雅安市| 玉树县| 全椒县| 山阳县| 鄂托克旗| 长兴县| 女性| 甘泉县| 博罗县| 泰和县| 韶关市| 吴江市| 江城| 库车县| 博爱县| 合阳县|