性欧美丰满熟妇xxxx性久久久,天堂中文官网在线,五月婷婷六月综合激情,偷窥日本少妇撒尿chinese

證監(jiān)會(huì)姚前談大模型生態(tài)建設(shè):標(biāo)準(zhǔn)制定和數(shù)據(jù)治理雙管齊下,構(gòu)建大模型訓(xùn)練數(shù)據(jù)要素市場(chǎng)

時(shí)間:2023-07-10 16:14:32       來源:21世紀(jì)經(jīng)濟(jì)報(bào)道

21世紀(jì)經(jīng)濟(jì)報(bào)道記者雷晨 北京報(bào)道

7月10日,中國(guó)證監(jiān)會(huì)科技監(jiān)管局局長(zhǎng)姚前在《中國(guó)金融》發(fā)表署名文章,文章分析了大模型的進(jìn)化與升級(jí)路徑,并通過探討大模型和中小模型可能的交互方式,闡述大模型的數(shù)據(jù)生態(tài)和模型生態(tài)建設(shè)。


(相關(guān)資料圖)

對(duì)于業(yè)界而言,上述文章為保障產(chǎn)業(yè)安全健康發(fā)展、規(guī)避數(shù)據(jù)和技術(shù)風(fēng)險(xiǎn)以及構(gòu)建可持續(xù)發(fā)展的大模型生態(tài)提供了相關(guān)思路。

談及大模型的升級(jí)與進(jìn)化路徑,姚前表示,從長(zhǎng)期視角來看,大模型的進(jìn)化衍生出眾多分支。最近一段時(shí)間,大模型迭代不僅速度加快,而且參與者也越來越多,基本上涵蓋了所有的大型科技公司,生態(tài)的多樣性和復(fù)雜性已初步顯現(xiàn)。

他認(rèn)為,目前大模型升級(jí)迭代過程中的底層算法框架并沒有本質(zhì)的變化,算力投入以及訓(xùn)練數(shù)據(jù)的豐富仍然是其快速進(jìn)化的關(guān)鍵,只不過最新的GPT4呈現(xiàn)出一些新的特征。一是算法方面更適配具體的下游任務(wù)。二是具備更規(guī)范的訓(xùn)練數(shù)據(jù)治理能力且支持多模態(tài)。三是構(gòu)建更強(qiáng)大的算力集群,以滿足更多的訓(xùn)練數(shù)據(jù)集和更大的輸入?yún)?shù)。

基于以上背景,姚前提出,需要建立一個(gè)各類模型健康交互和協(xié)同進(jìn)化的生態(tài),以保證大模型相關(guān)人工智能產(chǎn)業(yè)可以在各個(gè)應(yīng)用領(lǐng)域成功落地。

他表示,GPT類大模型功能強(qiáng)大,在未來會(huì)成為許多行業(yè)如互聯(lián)網(wǎng)、金融、醫(yī)療等領(lǐng)域的重要基礎(chǔ)設(shè)施之一。但在具體應(yīng)用落地的過程中,GPT類大模型還會(huì)面臨一系列挑戰(zhàn)。一是如何確保訓(xùn)練數(shù)據(jù)的數(shù)量與質(zhì)量。二是如何降低大模型的運(yùn)行和維護(hù)成本。

而由于大模型的性能依賴于訓(xùn)練數(shù)據(jù)的質(zhì)量,且模型在不同落地場(chǎng)景下所需的底層技術(shù)規(guī)格也不盡相同。因此,姚前認(rèn)為,構(gòu)建大模型持續(xù)發(fā)展、健康交互的良好產(chǎn)業(yè)生態(tài),必須推進(jìn)大模型訓(xùn)練數(shù)據(jù)與底層技術(shù)的標(biāo)準(zhǔn)化,加快模型的迭代與落地。

一方面,大模型自身的訓(xùn)練數(shù)據(jù)集以及定義的數(shù)據(jù)服務(wù)接口(API),將會(huì)成為行業(yè)的事實(shí)標(biāo)準(zhǔn),而接入大模型的各種應(yīng)用都必須遵循該標(biāo)準(zhǔn)。目前,模型“預(yù)訓(xùn)練+微調(diào)”已經(jīng)成為行業(yè)統(tǒng)一的標(biāo)準(zhǔn)流程和范式。在此基礎(chǔ)上,結(jié)合具體的應(yīng)用場(chǎng)景和專業(yè)數(shù)據(jù),可以進(jìn)一步定制和優(yōu)化各領(lǐng)域各行業(yè)的小模型。從某種程度上來說,大模型訓(xùn)練數(shù)據(jù)和數(shù)據(jù)服務(wù)接口標(biāo)準(zhǔn),將會(huì)成為下一代國(guó)際標(biāo)準(zhǔn)的核心之一。

另一方面,處理大模型訓(xùn)練數(shù)據(jù)的底層技術(shù)所需的工具鏈也必須產(chǎn)品化和標(biāo)準(zhǔn)化。大模型在標(biāo)準(zhǔn)化技術(shù)服務(wù)的有力支撐下,可輸出硬件適配、模型蒸餾和壓縮、模型分布式訓(xùn)練和加速、向量數(shù)據(jù)庫、圖數(shù)據(jù)庫、模型互聯(lián)互通等技術(shù)方案,提供自然語言處理、計(jì)算機(jī)視覺、跨模態(tài)、知識(shí)圖譜等各類能力,讓更多的企業(yè)、開發(fā)者可以低門檻地將大模型應(yīng)用于自身業(yè)務(wù)并構(gòu)建行業(yè)垂直模型,從而促進(jìn)人工智能在各領(lǐng)域廣泛落地。

值得注意的是,大模型的開發(fā)和應(yīng)用雖然會(huì)對(duì)產(chǎn)業(yè)和經(jīng)濟(jì)發(fā)展帶來巨大紅利,但如果不加以合理管控,也會(huì)給國(guó)家和產(chǎn)業(yè)安全帶來風(fēng)險(xiǎn)。一是數(shù)據(jù)泄露風(fēng)險(xiǎn)。大模型的訓(xùn)練、落地,都需要以海量的數(shù)據(jù)支撐,其中包含行業(yè)或個(gè)人敏感信息的數(shù)據(jù)。如果沒有合理的數(shù)據(jù)脫敏和數(shù)據(jù)托管機(jī)制,則可能造成數(shù)據(jù)泄露,給行業(yè)和個(gè)人造成損失。二是模型安全風(fēng)險(xiǎn)。比如,插件可能被植入有害內(nèi)容,成為不法分子欺詐和“投毒”的工具,危及社會(huì)和產(chǎn)業(yè)安全。

基于此,姚前提出了以下三方面的建議:

一是以大模型訓(xùn)練數(shù)據(jù)為抓手,標(biāo)準(zhǔn)制定和數(shù)據(jù)治理雙管齊下。通過制定模型應(yīng)用規(guī)范,統(tǒng)一接口標(biāo)準(zhǔn),促進(jìn)行業(yè)規(guī)范化發(fā)展??煽紤]對(duì)模型的合成數(shù)據(jù)進(jìn)行托管,以加強(qiáng)監(jiān)督,保障數(shù)據(jù)內(nèi)容合規(guī)、權(quán)益清晰、流通順暢。同時(shí)完善法律法規(guī),優(yōu)化政策制度,以多種途徑與方式形成監(jiān)管合力,嚴(yán)防惡意篡改模型和滲入有害數(shù)據(jù)等行為。

二是構(gòu)建大模型訓(xùn)練數(shù)據(jù)要素市場(chǎng)。厘清訓(xùn)練數(shù)據(jù)采集處理、合成數(shù)據(jù)服務(wù)、大小模型互聯(lián)互通、應(yīng)用API之間的產(chǎn)業(yè)鏈。加快數(shù)據(jù)要素市場(chǎng)建設(shè),為訓(xùn)練數(shù)據(jù)提供市場(chǎng)化定價(jià),以利權(quán)益分配與激勵(lì)。

三是構(gòu)建大小模型共生發(fā)展、相互促進(jìn)的良好生態(tài)。總體來看,目前國(guó)內(nèi)外主流大模型在算法層面尚不存在代際差,但是在算力和數(shù)據(jù)方面存有差距。建議在通用領(lǐng)域大力支持國(guó)內(nèi)頭部科技企業(yè)研發(fā)自主可控的國(guó)產(chǎn)大模型,同時(shí)鼓勵(lì)各垂直領(lǐng)域在大模型基礎(chǔ)上,利用開源工具構(gòu)建規(guī)范可控的自主工具鏈,既探索“大而強(qiáng)”的通用模型,又研發(fā)“小而美”的垂直行業(yè)模型,從而構(gòu)建基礎(chǔ)大模型和專業(yè)小模型交互共生、迭代進(jìn)化的良好生態(tài)。

標(biāo)簽:

首頁
頻道
底部
頂部