專(zhuān)題:2024中國(guó)高新技術(shù)論壇
“2024 中國(guó)高新技術(shù)論壇”于11月14日在深圳舉行。三六零數(shù)智化集團(tuán)首席產(chǎn)品官何帆出席并演講。
何帆建議將數(shù)據(jù)要素和大模型聯(lián)合起來(lái)在企業(yè)內(nèi)部落地過(guò)程中,按以下幾個(gè)步驟走:
一是匯聚各種多元數(shù)據(jù),在企業(yè)內(nèi)部構(gòu)建各種業(yè)務(wù)系統(tǒng)、第三方系統(tǒng)、SaaS應(yīng)用,已經(jīng)存在了各種各樣數(shù)據(jù),同時(shí)還有非常多非結(jié)構(gòu)化數(shù)據(jù),比如之前有一家航空公司去維修飛機(jī)各種各樣的操作手冊(cè)或者維修手冊(cè),分散在各個(gè)工程師的電腦里、服務(wù)器里,每一個(gè)工程師掌握的知識(shí)不一樣,而且這些非結(jié)構(gòu)化數(shù)據(jù)分散在各地。建議第一步做集中匯聚,進(jìn)行集中管理。連接模型,建立企業(yè)的知識(shí)中樞。
二是關(guān)聯(lián)知識(shí)庫(kù),企業(yè)內(nèi)部已經(jīng)形成各種各樣的知識(shí)庫(kù),沒(méi)必要再把它完整的訓(xùn)到模型里,但需要用搜索引擎連接這些知識(shí)庫(kù),用RAG看到底有哪些內(nèi)容,不管是結(jié)構(gòu)化還是非結(jié)構(gòu)化,甚至我們嘗試把非結(jié)構(gòu)化數(shù)據(jù)變成結(jié)構(gòu)化數(shù)據(jù)再做后面的RAG。
三是做完AI能力后,需要賦能給企業(yè)內(nèi)部已經(jīng)在使用的一些自動(dòng)化辦公系統(tǒng),比如我想定一張機(jī)票,可能內(nèi)部自動(dòng)提了一個(gè)出差申請(qǐng)后就可以給我一些機(jī)票建議,什么時(shí)間點(diǎn),有哪些機(jī)票,價(jià)格怎么樣,可以快速通過(guò)自然語(yǔ)言決定要不要定這張機(jī)票和酒店,快速完成應(yīng)用。這樣的前提是我們需要連接內(nèi)部各種各樣應(yīng)用來(lái)完成這件事,最后是跟各種各樣應(yīng)用打通。架構(gòu)里最后開(kāi)放生態(tài)的問(wèn)題,除了自己構(gòu)建的一些應(yīng)用,可以連接更多第三方應(yīng)用來(lái)完成。
以下為演講實(shí)錄:
何帆:大家好,我是三六零的何帆,我的議題主要是目前我國(guó)主推的數(shù)據(jù)要素市場(chǎng)如何靠大模型來(lái)激活數(shù)據(jù)要素價(jià)值。
我主要從背景、思想、方案、以及三六零的優(yōu)勢(shì)都跟大家做一個(gè)分享。
可能大家心目中三六零是一家安全公司,推出的免費(fèi)殺毒模式,靠360安全衛(wèi)士積累了大家看到的,比如目前國(guó)內(nèi)發(fā)現(xiàn)的大概有57個(gè)國(guó)家級(jí)黑客組織,包括美國(guó)的中情局、國(guó)安局都在這57個(gè)國(guó)家級(jí)黑客組織中,這57個(gè)中三六零發(fā)現(xiàn)了55個(gè),那三六零是依靠什么來(lái)達(dá)到這個(gè)效果和能力呢?安全背后是我們對(duì)大數(shù)據(jù)的分析和人工智能技術(shù)的支撐來(lái)完成的?,F(xiàn)在我們不但把安全拿出來(lái)商業(yè)化,更多的希望把人工智能應(yīng)用和技術(shù)以及對(duì)大數(shù)據(jù)的分析技術(shù)拿出來(lái),在前場(chǎng)做商業(yè)化,賦能政企單位。
從目前背景看:一是我國(guó)對(duì)數(shù)據(jù)要素市場(chǎng)的大力推動(dòng),頻繁的出臺(tái)了大量政策來(lái)支撐,以及像各省數(shù)據(jù)局、數(shù)據(jù)交易所的成立,大力推動(dòng)數(shù)據(jù)要素市場(chǎng);二是我國(guó)對(duì)人工智能提出了新的戰(zhàn)略高度,要大力發(fā)展人工智能領(lǐng)域,尤其在大模型領(lǐng)域的發(fā)展。
在這兩個(gè)背景下,“數(shù)算智”是一個(gè)新的引擎,來(lái)達(dá)到一個(gè)新的新質(zhì)生產(chǎn)力,而且通過(guò)各種各樣的事件包括Open AI發(fā)布的各種各樣論文能看到高質(zhì)量的數(shù)據(jù)集對(duì)于大模型的質(zhì)量是非常重要的,并且大模型的運(yùn)算后期形成一個(gè)反哺的過(guò)程。
從人工智能價(jià)值落地上,數(shù)據(jù)和大模型是非常重要的兩個(gè)因素。在To B場(chǎng)景落地時(shí),比如對(duì)于個(gè)人支持的理解、企業(yè)支持的理解慢慢用大模型做融合,達(dá)到下一步的效果。
人工智能、數(shù)據(jù)要素這兩個(gè)領(lǐng)域大的國(guó)家要大力推動(dòng)背景下,希望用人工智能激活數(shù)據(jù)要素的價(jià)值,靠數(shù)據(jù)要素再反哺人工智能能力的推動(dòng)。
在這個(gè)背景下我們提出“存智一體”思路,“存”里,希望把大量企業(yè)數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)集中進(jìn)行存儲(chǔ),用“智”完成價(jià)值轉(zhuǎn)化。我們自研了自己文檔類(lèi)型的大模型,包括OCR能力、版式識(shí)別能力,讓大模型搜得到并且答得準(zhǔn)。
我們推出了一個(gè)完整框架,下面是“存”,上面是“智”。數(shù)據(jù)來(lái)源,各種各樣企事業(yè)單位已經(jīng)內(nèi)建了一系列辦公、業(yè)務(wù)上的應(yīng)用,比如即時(shí)通信、電子郵件、CRM、OA等,里面都存在大量數(shù)據(jù),需要用一系列的連接器,把各種數(shù)據(jù)完成集中的采集和存儲(chǔ),同時(shí)把一些基礎(chǔ)資源包括云計(jì)算資源用到公有云資源、私有云資源、混合云資源,集中進(jìn)行管理。
“智”,需要構(gòu)建一個(gè)完整的AI應(yīng)用平臺(tái),這個(gè)平臺(tái)里包括大模型、Agent、RAG等,同時(shí)也是三六零需要關(guān)注的數(shù)據(jù)隱私、數(shù)據(jù)泄露問(wèn)題,都是非常重要的在數(shù)據(jù)要素和人工智能里非常關(guān)鍵的,如果數(shù)據(jù)安全沒(méi)有辦法保障,業(yè)務(wù)跑起來(lái)是非常大的隱患。
在這個(gè)架構(gòu)下推出一系列應(yīng)用,包括我們自己的應(yīng)用、企業(yè)內(nèi)部應(yīng)用、智能應(yīng)用平臺(tái),來(lái)完成整個(gè)架構(gòu)的搭建。
在這個(gè)前提下做了一系列實(shí)踐,我們建議將數(shù)據(jù)要素和大模型聯(lián)合起來(lái)在企業(yè)內(nèi)部落地過(guò)程中,按這幾個(gè)步驟走:一是匯聚各種多元數(shù)據(jù),在企業(yè)內(nèi)部構(gòu)建各種業(yè)務(wù)系統(tǒng)、第三方系統(tǒng)、SaaS應(yīng)用,已經(jīng)存在了各種各樣數(shù)據(jù),同時(shí)還有非常多非結(jié)構(gòu)化數(shù)據(jù),比如之前有一家航空公司去維修飛機(jī)各種各樣的操作手冊(cè)或者維修手冊(cè),分散在各個(gè)工程師的電腦里、服務(wù)器里,每一個(gè)工程師掌握的知識(shí)不一樣,而且這些非結(jié)構(gòu)化數(shù)據(jù)分散在各地。建議第一步做集中匯聚,進(jìn)行集中管理。連接模型,建立企業(yè)的知識(shí)中樞。今年上半年三六零開(kāi)的ISC大會(huì)上,我們的創(chuàng)始人周鴻祎先生帶領(lǐng)國(guó)內(nèi)16家領(lǐng)先大模型公司集成了大模型生態(tài),并開(kāi)發(fā)了AI助手功能,我們的底座平臺(tái)已經(jīng)連接了國(guó)內(nèi)最主流的16家大模型,上層智能應(yīng)用可以連接底層各種各樣的大模型,并且API完全打通。
關(guān)聯(lián)知識(shí)庫(kù),企業(yè)內(nèi)部已經(jīng)形成各種各樣的知識(shí)庫(kù),沒(méi)必要再把它完整的訓(xùn)到模型里,但需要用搜索引擎連接這些知識(shí)庫(kù),用RAG看到底有哪些內(nèi)容,不管是結(jié)構(gòu)化還是非結(jié)構(gòu)化,甚至我們嘗試把非結(jié)構(gòu)化數(shù)據(jù)變成結(jié)構(gòu)化數(shù)據(jù)再做后面的RAG。
做完AI能力后,需要賦能給企業(yè)內(nèi)部已經(jīng)在使用的一些自動(dòng)化辦公系統(tǒng),比如我想定一張機(jī)票,可能內(nèi)部自動(dòng)提了一個(gè)出差申請(qǐng)后就可以給我一些機(jī)票建議,什么時(shí)間點(diǎn),有哪些機(jī)票,價(jià)格怎么樣,可以快速通過(guò)自然語(yǔ)言決定要不要定這張機(jī)票和酒店,快速完成應(yīng)用。這樣的前提是我們需要連接內(nèi)部各種各樣應(yīng)用來(lái)完成這件事,最后是跟各種各樣應(yīng)用打通。架構(gòu)里最后開(kāi)放生態(tài)的問(wèn)題,除了自己構(gòu)建的一些應(yīng)用,可以連接更多第三方應(yīng)用來(lái)完成。
在這個(gè)五步曲下我們已經(jīng)完成哪些實(shí)踐?這是我們?cè)诟鞯卣瓿傻模颜?wù)關(guān)鍵數(shù)據(jù)用模型賦能,從“萬(wàn)事通”變成“政務(wù)通”,比如需要對(duì)領(lǐng)導(dǎo)完成信息的角色、縱覽,對(duì)外完成政務(wù)問(wèn)答等等,比如一些政策咨詢。我們?cè)谝粋€(gè)政務(wù)單位做政策問(wèn)答,比如小升初的政策是什么,能讀哪些學(xué)校,快速能給公眾一些非常準(zhǔn)確的答案。
教育領(lǐng)域,非常私有化的數(shù)據(jù)通過(guò)模型賦能,可以在教學(xué)上有很多場(chǎng)景,比如智能交互以及多媒體教育當(dāng)中通過(guò)多模態(tài)對(duì)它進(jìn)行更多賦能。
制造領(lǐng)域,比如我們?cè)谀硞€(gè)航空公司的案例,把工業(yè)維修SOP生成,比如標(biāo)準(zhǔn)操作步驟用模型生成,生成后由工程師完成后續(xù)操作,并且在操作過(guò)程中可以跟模型進(jìn)行多輪交互。我現(xiàn)在遇到的飛機(jī)故障應(yīng)該怎么樣維修,維修具體的描述在我維修手冊(cè)的哪個(gè)章節(jié),都有非常準(zhǔn)確的定位,同時(shí)它跟其他的IT系統(tǒng)交互后,可以快速完成工單創(chuàng)建和完結(jié)。
健康領(lǐng)域,可能健康是我們非常關(guān)注的領(lǐng)域,比如智能的AI醫(yī)生,在醫(yī)院內(nèi)部智能的導(dǎo)覽、智能的醫(yī)療導(dǎo)航,比如幾樓幾層有哪個(gè)科室,掛號(hào)、做CT需要去哪里,完全可以依靠大模型和AI。
最后稍微講一下目前三六零數(shù)智化部分的核心能力。
我們現(xiàn)在在全國(guó)范圍內(nèi)做了大概30多個(gè)數(shù)智化產(chǎn)業(yè)基地,包括城市大腦。我們跟當(dāng)?shù)卣献饕呀?jīng)完成人工智能各種各樣基礎(chǔ)設(shè)施的落地,我們把生態(tài)大模型、開(kāi)源模型放過(guò)去,上層大模型LLMOps平臺(tái)以及對(duì)接的各種各樣應(yīng)用,這個(gè)模式落地后我們提供給當(dāng)?shù)氐奈k局和企事業(yè)單位做初級(jí)應(yīng)用,在此基礎(chǔ)上有些增值付費(fèi)服務(wù)出來(lái)。
大模型領(lǐng)域,我們是大模型標(biāo)準(zhǔn)聯(lián)合組組長(zhǎng),是目前大模型標(biāo)準(zhǔn)編寫(xiě)單位之一,所以我們現(xiàn)在參評(píng)的大模型標(biāo)準(zhǔn)包括國(guó)標(biāo)13項(xiàng),行標(biāo)3項(xiàng),團(tuán)體標(biāo)準(zhǔn)4項(xiàng)等等。
三六零大家熟知的一直是網(wǎng)絡(luò)安全領(lǐng)域,多數(shù)時(shí)是外交部發(fā)言人說(shuō)我們針對(duì)國(guó)家地震局或者西工大等關(guān)鍵技術(shù)設(shè)施,來(lái)自國(guó)外的黑客組織發(fā)起的攻擊。但剛剛也談到我們?cè)谌斯ぶ悄艿纳罡胚_(dá)到這個(gè)效果,2010年開(kāi)始在人工智能領(lǐng)域耕耘,2015年成立了我們自己人工智能研究院,一路走來(lái),在全國(guó)范圍內(nèi)包括很多技術(shù)領(lǐng)域上已經(jīng)有非常多沉淀。
可能今天很多嘉賓都談到一個(gè)共識(shí)的話題,對(duì)于模型而言,高質(zhì)量的數(shù)據(jù)集是非常重要的元素。三六零本身是一家互聯(lián)網(wǎng)公司,依靠C端免費(fèi)模式幫我們積累了大量高質(zhì)量數(shù)據(jù)集,同時(shí)有大量C端應(yīng)用,比如360安全衛(wèi)士、360瀏覽器等等,幫我們積累了大量高質(zhì)量數(shù)據(jù),并且根據(jù)最新數(shù)據(jù),三六零的AI搜索現(xiàn)在也是web訪問(wèn)量排名第一的搜索引擎,在搜索引擎領(lǐng)域也幫助我們積累了大量高質(zhì)量數(shù)據(jù)集,幫我們從模型訓(xùn)練以及對(duì)數(shù)據(jù)應(yīng)用理解上積累了大量工程化的能力。
最后一部分是安全。
本身三六零是一家安全公司,三六零發(fā)布的各種各樣應(yīng)用包括大模型應(yīng)用在內(nèi),被國(guó)內(nèi)外大量網(wǎng)絡(luò)安全愛(ài)好者、黑客首當(dāng)其沖的作為測(cè)試目標(biāo)。如果你發(fā)布一款應(yīng)用,可能會(huì)被大量人拿來(lái)做測(cè)試,看能不能攻進(jìn)去。在這個(gè)領(lǐng)域我們也積累了非常多經(jīng)驗(yàn),所以我們現(xiàn)在提出一個(gè)比較先進(jìn)的理念,用大模型保護(hù)大模型,對(duì)大模型各種各樣內(nèi)容的輸入輸出,需要用大模型判斷它的合理性,這個(gè)會(huì)不會(huì)給我造成攻擊,它的合法性需要做檢測(cè),輸出的內(nèi)容是不是合規(guī),會(huì)不會(huì)造成信息泄露。我們之前看到三星內(nèi)部的數(shù)據(jù)泄露,都是把高質(zhì)量數(shù)據(jù)放到大模型以及大模型應(yīng)用過(guò)程中帶來(lái)的數(shù)據(jù)隱私問(wèn)題、數(shù)據(jù)泄露問(wèn)題。
我們提出“以模制?!笨煽貑?wèn)題、內(nèi)容安全、幻覺(jué)問(wèn)題、提示注入攻擊、數(shù)據(jù)安全。非常強(qiáng)大的安全大模型,它能夠保護(hù)到通用或者數(shù)字化大模型各種各樣的應(yīng)用。
我的分享大概就這些,謝謝大家!
新浪聲明:所有會(huì)議實(shí)錄均為現(xiàn)場(chǎng)速記整理,未經(jīng)演講者審閱,新浪網(wǎng)登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其描述。
發(fā)表評(píng)論