-
專訪數(shù)庫(kù)創(chuàng)始人:通用大模型發(fā)展到極致,還有漫長(zhǎng)的過(guò)程
-
呂棟lvdong@guancha.cn
最后更新: 2024-05-08 22:46:59【文/觀察者網(wǎng) 呂棟】
“我們現(xiàn)在主要在使用OpenAI的模型,同時(shí)我們也測(cè)試了一系列國(guó)內(nèi)的大模型,他們的進(jìn)步都很快,但目前來(lái)看,在成熟度上還可以進(jìn)一步提高?!?月7日,數(shù)庫(kù)科技創(chuàng)始人兼總裁沈鑫在第六屆世界人工智能大會(huì)(WAIC)現(xiàn)場(chǎng)接受觀察者網(wǎng)對(duì)話時(shí)說(shuō)道。
他認(rèn)為,如果通用大模型發(fā)展到極致的話,也就不存在什么行業(yè)大模型了,但這是非常漫長(zhǎng)的過(guò)程。因?yàn)槟苷嬲┐竽P褪褂玫母哔|(zhì)量數(shù)據(jù)非常缺乏。比如能把金融相關(guān)數(shù)據(jù)標(biāo)準(zhǔn)做到很高的公司屈指可數(shù),而這些公司肯定不會(huì)把數(shù)據(jù)貢獻(xiàn)給別人。
數(shù)庫(kù)科技創(chuàng)始人兼總裁沈鑫
沈鑫向觀察者網(wǎng)坦言,今天人類所處的是一個(gè)萬(wàn)物互聯(lián)的世界,所有的產(chǎn)業(yè)是連接在一起的。以前可能分析芯片的和分析汽車的人士很少產(chǎn)生交集,但今天產(chǎn)業(yè)網(wǎng)絡(luò)是交織狀的,對(duì)人的分析能力要求非常高。在這種情況下,數(shù)據(jù)的連接和編織,對(duì)幫助人們做決策顯得尤為重要。
他同時(shí)也提到,這個(gè)世界不存在所謂的“魔術(shù)”,大模型也不會(huì)一下把所有問(wèn)題都解決。因?yàn)榇竽P捅旧硎且粋€(gè)效率工具,“我們現(xiàn)在會(huì)把大模型的一些技術(shù)融入到數(shù)據(jù)生產(chǎn)端,進(jìn)一步去提升生產(chǎn)效率。這個(gè)實(shí)際上是我們看待大模型的一個(gè)點(diǎn),不要為了技術(shù)而技術(shù)”。
數(shù)庫(kù)科技成立于2009年,由海歸的沈鑫和劉彥海創(chuàng)立,該公司主要是在金融及產(chǎn)業(yè)領(lǐng)域提供基于產(chǎn)業(yè)邏輯的智能數(shù)據(jù)產(chǎn)品與系統(tǒng)服務(wù),幫助金融機(jī)構(gòu)、企業(yè)集團(tuán)、政府部門解決業(yè)務(wù)場(chǎng)景中的數(shù)據(jù)和系統(tǒng)需求。
在本屆WAIC現(xiàn)場(chǎng),觀察者網(wǎng)體驗(yàn)了數(shù)庫(kù)科技發(fā)布的概念型產(chǎn)品圖譜——istari,用戶輸入問(wèn)題用大語(yǔ)言模型解析后,即可轉(zhuǎn)化成統(tǒng)一產(chǎn)品知識(shí)圖譜(UPG)相關(guān)的查詢,呈現(xiàn)出相關(guān)的專業(yè)產(chǎn)業(yè)知識(shí)以及各個(gè)知識(shí)點(diǎn)之間的關(guān)系,該產(chǎn)品主要通過(guò)大模型來(lái)做產(chǎn)業(yè)關(guān)系的推演。
以下是對(duì)話實(shí)錄:
觀察者網(wǎng):今年數(shù)庫(kù)的展臺(tái)比去年要大,重點(diǎn)在展示哪些內(nèi)容?
沈鑫:相比去年,今年展出的內(nèi)容更多是增強(qiáng)和產(chǎn)品化。比如說(shuō)銀行對(duì)公,去年是方案,今年是標(biāo)準(zhǔn)化產(chǎn)品。因?yàn)殡S著時(shí)間推移,公司想要發(fā)展的話,產(chǎn)品化程度必須越來(lái)越高。目前數(shù)字化轉(zhuǎn)型大家還都在摸索,隨著接觸的客戶越來(lái)越多,我們要把其中共性的需求提取出來(lái)。因?yàn)槲覀兊哪繕?biāo)并不是只服務(wù)于頭部金融機(jī)構(gòu),還要服務(wù)于數(shù)量眾多的中小銀行,他們可能沒(méi)有那么多資源和能力,在這種情況下,標(biāo)準(zhǔn)化產(chǎn)品對(duì)他們來(lái)說(shuō)就很重要。而且他們?cè)隗w會(huì)到標(biāo)準(zhǔn)化產(chǎn)品的好處之后,才更有決心和信心投入更多成本去做的更加精細(xì)。
觀察者網(wǎng):連續(xù)參展世界人工智能大會(huì),數(shù)庫(kù)業(yè)務(wù)是怎么跟人工智能技術(shù)結(jié)合的?
沈鑫:技術(shù)永遠(yuǎn)是工具,所以數(shù)庫(kù)將大量人工智能技術(shù)用在數(shù)據(jù)生產(chǎn)、數(shù)據(jù)解析和數(shù)據(jù)編織三個(gè)層面。技術(shù)賦能是底層能力,我們從來(lái)不直接拿技術(shù)去變現(xiàn),這種級(jí)別的炫技沒(méi)有意義。一個(gè)公司要想可持續(xù)發(fā)展,關(guān)鍵是要夯實(shí)底層能力。就像運(yùn)動(dòng)員一樣,平時(shí)做的最多的反而是體能訓(xùn)練,雖然最后真實(shí)發(fā)揮的水平跟心態(tài)也有關(guān),但底層能力還是最核心的。
觀察者網(wǎng):數(shù)庫(kù)現(xiàn)在利用的人工智能底層技術(shù)能力有哪些?
沈鑫:我們?cè)诜治龊徒馕霾煌愋蛿?shù)據(jù)時(shí),會(huì)用到各種各樣的小模型,比如說(shuō)NLP(自然語(yǔ)言處理)等。我們以前不做需要海量人工標(biāo)注的數(shù)據(jù)集,因?yàn)檫@會(huì)降低毛利率。但今天通過(guò)大模型,我們可以做海量數(shù)據(jù)標(biāo)注,具體是先通過(guò)小模型把大的段落拆成小的,再用大模型把關(guān)鍵要素提取出來(lái)。通過(guò)把工程化的技術(shù)整合到一起,再把數(shù)據(jù)工廠做進(jìn)一步的增強(qiáng)。
觀察者網(wǎng):目前數(shù)庫(kù)所利用的模型能力,是自研模型,還是使用市場(chǎng)上的模型?
沈鑫:我們不會(huì)自己去做大模型,因?yàn)榇竽P褪且粋€(gè)長(zhǎng)期投入才能出效果的技術(shù),適合大廠來(lái)做,而且大模型也有現(xiàn)成的。數(shù)庫(kù)現(xiàn)在也在接入OpenAI,國(guó)內(nèi)的大模型像百度的文心我們也在測(cè)試。我們?cè)诖怪鳖I(lǐng)域中用好工具就行了,而且可以誰(shuí)的大模型好用就用誰(shuí)的。我們更專注垂直領(lǐng)域,包括金融機(jī)構(gòu)也不可能自己去研發(fā)大模型,也是用現(xiàn)成的。因此我們一方面要把市場(chǎng)上大模型的水平認(rèn)知清楚,另一方面我們要把客戶需要的東西兼容上去。
觀察者網(wǎng):目前數(shù)庫(kù)主要在和市場(chǎng)上哪些大模型合作?
沈鑫:我們現(xiàn)在主要在使用OpenAI的模型,同時(shí)我們也測(cè)試了一系列國(guó)內(nèi)的大模型,他們的進(jìn)步都很快,但目前來(lái)看,在成熟度上還可以進(jìn)一步提高。
觀察者網(wǎng):如何看待大模型的應(yīng)用?
沈鑫:這個(gè)世界不存在所謂的“魔術(shù)”,大模型也不可能一下把所有問(wèn)題都解決。因?yàn)榇竽P捅旧硎且粋€(gè)效率工具,我們現(xiàn)在會(huì)把大模型的一些技術(shù)融入到數(shù)據(jù)生產(chǎn)端,進(jìn)一步去提升生產(chǎn)效率。這個(gè)實(shí)際上是我們看待大模型的一個(gè)點(diǎn),不要為了技術(shù)而技術(shù)。
觀察者網(wǎng):如何看待通用大模型和行業(yè)大模型之間的應(yīng)用場(chǎng)景沖突?
沈鑫:如果通用大模型發(fā)展到極致的話,我覺得也就不存在什么行業(yè)大模型,但這是非常漫長(zhǎng)的過(guò)程。能夠真正供大模型使用的高質(zhì)量數(shù)據(jù)是非常缺乏的。
比如我們行業(yè)里,能把金融相關(guān)數(shù)據(jù)標(biāo)準(zhǔn)做到很高的公司,可能掰手指頭都數(shù)得出來(lái),而這幾家肯定不會(huì)把數(shù)據(jù)貢獻(xiàn)給別人。所以它其實(shí)是一個(gè)漫長(zhǎng)的過(guò)程,沒(méi)有大家想象得那么快。另外一個(gè)點(diǎn),很多的場(chǎng)景是不需要用到大模型的。可能在咨詢服務(wù)類的場(chǎng)景中大模型有很大的用場(chǎng),但是在金融這種對(duì)數(shù)據(jù)要求很嚴(yán)謹(jǐn)?shù)男袠I(yè)內(nèi),大模型實(shí)際是沒(méi)有意義的,因?yàn)榛仞伿窍鄬?duì)比較模糊的。
觀察者網(wǎng):應(yīng)該怎樣理解數(shù)庫(kù)的業(yè)務(wù),或者說(shuō)數(shù)庫(kù)是如何使用數(shù)據(jù)的?
沈鑫:我們是把市場(chǎng)上所有看上去像孤島的數(shù)據(jù)融合連接起來(lái)。在這樣的數(shù)據(jù)網(wǎng)絡(luò)中,去尋找外界難以捕捉到的一些有用的信息點(diǎn)。因?yàn)槿说乃季S總是有限的,能力再?gòu)?qiáng)的專家,可能也只是在一兩個(gè)領(lǐng)域比較專業(yè),一旦跨領(lǐng)域可能就無(wú)能為力。今天我們所處的是一個(gè)萬(wàn)物互聯(lián)的世界,所有的產(chǎn)業(yè)是連接在一起的。以前我們可能會(huì)說(shuō),分析芯片的和分析汽車的很少產(chǎn)生交集,但今天新能源汽車已經(jīng)離不開芯片,產(chǎn)業(yè)網(wǎng)絡(luò)是交織狀的,對(duì)人的分析能力要求非常高。在這種情況下,數(shù)據(jù)的連接和編織,對(duì)幫助人們做決策就顯得尤為重要。
觀察者網(wǎng):目前數(shù)庫(kù)研發(fā)人員的占比大概是什么情況?
沈鑫:我們現(xiàn)在有兩百多名員工,其中有一百多人在做研發(fā),占比超過(guò)一半,這些研發(fā)人員也在不斷夯實(shí)數(shù)庫(kù)的底層能力。當(dāng)?shù)讓蛹夹g(shù)能力達(dá)到一定水平的時(shí)候,你就會(huì)發(fā)現(xiàn)數(shù)據(jù)提取能力和數(shù)據(jù)精度全部都在上升。這就跟中國(guó)發(fā)射火箭探月一樣,航天技術(shù)一旦突破,所有的技術(shù)點(diǎn)在民用領(lǐng)域都會(huì)整體提升。
觀察者網(wǎng):數(shù)庫(kù)現(xiàn)在的營(yíng)收大概是什么樣的水平,未來(lái)有沒(méi)有IPO的計(jì)劃?
沈鑫:我們的營(yíng)收已經(jīng)破億了,去年業(yè)務(wù)體量翻了三倍,今年還要再翻一倍。我覺的無(wú)論是IPO也好,還是未來(lái)任何資本市場(chǎng)的出路也好,都取決于公司的基本面,也就是有沒(méi)有真正為客戶創(chuàng)造價(jià)值。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 呂棟
-
國(guó)際首次!“量子模擬的圣杯之一”,我國(guó)科學(xué)家取得重大進(jìn)展
2024-05-06 12:12 科技前沿 -
嫦娥六號(hào)成功發(fā)射!開啟人類首次月球背面取樣之旅
2024-05-03 17:19 航空航天 -
環(huán)環(huán)相扣、步步關(guān)鍵!嫦娥六號(hào)月背出差之旅日程表
2024-05-03 16:22 航空航天 -
今天上午太陽(yáng)爆發(fā)強(qiáng)耀斑,對(duì)我國(guó)上空電離層產(chǎn)生影響
2024-05-03 14:09 天文 -
嫦娥六號(hào)任務(wù)首選窗口瞄準(zhǔn)今日17時(shí)27分發(fā)射
2024-05-03 07:39 航空航天 -
嫦娥六號(hào)計(jì)劃5月3日發(fā)射
2024-05-01 18:26 航空航天 -
準(zhǔn)備就緒!嫦娥六號(hào)完成發(fā)射前最后一次系統(tǒng)間全區(qū)合練
2024-05-01 15:52 航空航天 -
幣安創(chuàng)始人趙長(zhǎng)鵬被判4個(gè)月監(jiān)禁
2024-05-01 10:10 瘋狂比特幣 -
中美研究合作:核聚變實(shí)驗(yàn)實(shí)現(xiàn)兩方面關(guān)鍵技術(shù)突破
2024-04-30 07:33 科技前沿 -
-
-
刷新紀(jì)錄!這一國(guó)產(chǎn)芯片交付
2024-04-26 09:13 科技前沿 -
?華為官宣:盤古大模型5.0將和“純血鴻蒙”一同亮相
2024-04-25 10:37 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
楊利偉獲得錢學(xué)森最高成就獎(jiǎng)
2024-04-24 15:36 航空航天 -
“80后”神十八乘組亮相 簡(jiǎn)歷來(lái)了
2024-04-24 11:13 航空航天 -
中國(guó)將實(shí)施國(guó)內(nèi)首次在軌水生生態(tài)研究項(xiàng)目
2024-04-24 09:40 航空航天 -
《三體》重要情節(jié)被驗(yàn)證?中國(guó)科學(xué)家首次觀測(cè)到電磁波動(dòng)態(tài)傳播
2024-04-23 20:29 三體 -
-
阿斯麥:不走了,就在荷蘭擴(kuò)張
2024-04-23 11:08 觀網(wǎng)財(cái)經(jīng)-海外 -
神十八發(fā)射場(chǎng)區(qū)全系統(tǒng)合練,近日將擇機(jī)發(fā)射
2024-04-21 16:56 航空航天
相關(guān)推薦 -
-
特朗普準(zhǔn)備賣了“美國(guó)之音”總部大樓 評(píng)論 119美大使“委屈”上了:加拿大抵制美貨是侮辱 評(píng)論 58沃爾瑪準(zhǔn)備以關(guān)稅為由漲價(jià),特朗普威脅 評(píng)論 161臺(tái)“邦交”危機(jī)再起?“不意外,轉(zhuǎn)向或已近尾聲” 評(píng)論 62“船、箱雙雙告急!兩個(gè)月后更糟了” 評(píng)論 121最新聞 Hot
-
特朗普準(zhǔn)備賣了“美國(guó)之音”總部大樓
-
沃爾瑪準(zhǔn)備以關(guān)稅為由漲價(jià),特朗普威脅
-
馬克龍“搭手示強(qiáng)”,反被埃爾多安“拿捏”
-
他痛批特朗普撒謊“不值一駁”,“令美國(guó)人民蒙羞”
-
美大使“委屈”上了:加拿大抵制美貨是侮辱
-
面臨高關(guān)稅壓力,越美完成首次線下部長(zhǎng)級(jí)磋商
-
臺(tái)“邦交”危機(jī)再起?“不意外,轉(zhuǎn)向或已近尾聲”
-
“船、箱雙雙告急!兩個(gè)月后更糟了”
-
克宮:“普澤會(huì)”有可能,只要…
-
小米汽車回應(yīng)“部分SU7前保險(xiǎn)杠形變”
-
惡意傳播涉劉國(guó)梁不實(shí)信息,杜某川、湯某被處罰
-
韓船企利潤(rùn)大增,中國(guó)被撼動(dòng)?
-
美軍高官急眼:中國(guó)在拉美居然整了10個(gè),沒(méi)人管…
-
無(wú)法一一談判,特朗普放話:將被單方面加稅
-
湖南懷化舞水河近期出現(xiàn)大量死魚,當(dāng)?shù)鼗貞?yīng)
-
穆迪下調(diào)美國(guó)信用評(píng)級(jí),白宮急了:這是政治決定
快訊- 中共中央、國(guó)務(wù)院印發(fā)《黨政機(jī)關(guān)厲行節(jié)約反對(duì)浪費(fèi)條例》
- 國(guó)家醫(yī)保局釋疑:為什么便宜的X光檢查越來(lái)越少,貴的CT檢查越來(lái)越多?
- 漸凍癥“斗士”蔡磊,獲全國(guó)表彰
- 捐贈(zèng)儀式舉行,這枚金印證實(shí)西晉與高句麗統(tǒng)屬關(guān)系
- 廣東高州發(fā)生山體滑坡,已致2死1失聯(lián)
- 抗戰(zhàn)史上的今天:5月18日
- 同比增長(zhǎng)12.5%!一季度末普惠型小微企業(yè)貸款余額超35萬(wàn)億元
- 天問(wèn)二號(hào)探測(cè)器順利轉(zhuǎn)入發(fā)射區(qū),計(jì)劃5月底擇機(jī)發(fā)射
-