(圖為:費(fèi)馬科技CEO洪春濤)
DoNews 3月9日消息(記者 向密) 說(shuō)起大數(shù)據(jù)和云計(jì)算,人們幾乎耳熟能詳。但若提到圖計(jì)算,了解的可能寥寥無(wú)幾。
事實(shí)上,作為最近幾年迅速發(fā)展的新技術(shù),圖計(jì)算技術(shù)目前在金融、工業(yè)、互聯(lián)網(wǎng)等多個(gè)領(lǐng)域已有廣泛應(yīng)用,尤其在金融反洗錢(qián)、發(fā)欺詐領(lǐng)域。而意識(shí)到圖計(jì)算技術(shù)重要性的大型企業(yè),也紛紛加大對(duì)圖計(jì)算領(lǐng)域的投入。
費(fèi)馬科技CEO洪春濤在接受DoNews專(zhuān)訪(fǎng)時(shí)表示,大數(shù)據(jù)實(shí)質(zhì)上是把很多數(shù)據(jù)聚攏到一起。按照傳統(tǒng)方式收集的數(shù)據(jù),一般來(lái)說(shuō)都是以二維表的形式進(jìn)行存儲(chǔ),類(lèi)似Excel里二維導(dǎo)航由列到行的方式。當(dāng)人們?nèi)コ橄?、去?jì)算的時(shí)候,也是按照這種形式去思考。
不過(guò),現(xiàn)實(shí)當(dāng)中有一些數(shù)據(jù),不太方便用這種方式來(lái)抽象,比如說(shuō)社交網(wǎng)絡(luò),誰(shuí)關(guān)注了誰(shuí),誰(shuí)跟誰(shuí)是好朋友等。事實(shí)上,它更像一張網(wǎng)絡(luò)一樣的東西,有著很多的節(jié)點(diǎn),并不適合用二維數(shù)據(jù)方式進(jìn)行處理。存在形式的不同,促使了抽象和計(jì)算方式的改變,推動(dòng)了圖計(jì)算技術(shù)的發(fā)展。
那么,何為圖計(jì)算?圖的英文名字叫Graph,是用于表示對(duì)象之間關(guān)聯(lián)關(guān)系的一種抽象數(shù)據(jù)結(jié)構(gòu),使用頂點(diǎn)和邊進(jìn)行描述。而圖計(jì)算,便是以圖作為數(shù)據(jù)模型來(lái)表達(dá)問(wèn)題并予以解決的這一過(guò)程。最近被市場(chǎng)炒得火熱的知識(shí)圖譜,就是圖計(jì)算的一種。
洪春濤介紹,對(duì)于圖計(jì)算技術(shù)的研究,最早可追溯至20世紀(jì)四五十年代。但圖計(jì)算逐漸進(jìn)入人們視野,則是因2010年谷歌發(fā)布的一篇圖計(jì)算論文引起。隨著新技術(shù)和新業(yè)務(wù)的推動(dòng),目前圖計(jì)算技術(shù)已進(jìn)入臨近爆發(fā)的前夜。
相比2003年左右發(fā)展起來(lái)的大數(shù)據(jù),圖計(jì)算處理的最大難點(diǎn)在于數(shù)據(jù)處理的不規(guī)整。由于大數(shù)據(jù)處理的是很規(guī)整的數(shù)據(jù),因此處理起來(lái)相當(dāng)高效。而圖計(jì)算這種網(wǎng)絡(luò)數(shù)據(jù),由于很不規(guī)整,因此處理起來(lái)非常吃力,在處理億級(jí)以上的海量數(shù)據(jù)時(shí)尤其如此。
不過(guò),圖計(jì)算卻是天然的存在,具有廣闊的應(yīng)用前景。洪春濤預(yù)計(jì),圖計(jì)算的市場(chǎng)容量可能為云計(jì)算的10%,即高達(dá)千億規(guī)模?;蛟S,這也是眾多初創(chuàng)者,紛紛進(jìn)入這一領(lǐng)域淘金的原因之一。
深耕圖計(jì)算的清華博士團(tuán)
北京費(fèi)馬科技有限公司成立于2016年,由畢業(yè)于清華大學(xué)的多名博士在清華教授的支持下聯(lián)合組建,是一家專(zhuān)注于圖數(shù)據(jù)技術(shù),為企業(yè)提供高性能圖數(shù)據(jù)存儲(chǔ)及分析平臺(tái)的國(guó)家高新技術(shù)企業(yè),其核心成員涵蓋大數(shù)據(jù)、圖計(jì)算、并行計(jì)算、機(jī)器學(xué)習(xí)等領(lǐng)域科學(xué)家。
(圖為:費(fèi)馬科技高管團(tuán)隊(duì))
技術(shù)硬核是費(fèi)馬科技創(chuàng)業(yè)團(tuán)隊(duì)的標(biāo)簽之一。據(jù)費(fèi)馬科技官網(wǎng)介紹,在公司成立之前,CEO洪春濤已在分布式計(jì)算、并行計(jì)算、圖數(shù)據(jù)庫(kù)、圖計(jì)算和大數(shù)據(jù)領(lǐng)域深耕15年。他曾在清華博士期間編寫(xiě)了世界上第一個(gè)開(kāi)源分布式C++圖計(jì)算系統(tǒng),也曾在加入微軟亞洲研究院的6年中,主導(dǎo)設(shè)計(jì)了微軟下一代大數(shù)據(jù)平臺(tái)和分布式機(jī)器學(xué)習(xí)平臺(tái),協(xié)助Bing搜索團(tuán)隊(duì)實(shí)現(xiàn)早期原型設(shè)計(jì),以及創(chuàng)立開(kāi)源深度學(xué)習(xí)平臺(tái)mxnet等。
創(chuàng)始團(tuán)隊(duì)的另一成員,現(xiàn)任費(fèi)馬科技CTO的朱曉偉,曾在業(yè)界頂級(jí)會(huì)議發(fā)表多篇學(xué)術(shù)論文。他開(kāi)發(fā)了最快的圖計(jì)算軟件平臺(tái)Gemini,作為圖數(shù)據(jù)領(lǐng)域的標(biāo)桿被引用上百次,填補(bǔ)了國(guó)內(nèi)圖數(shù)據(jù)及圖計(jì)算領(lǐng)域的空白。
現(xiàn)任公司聯(lián)合創(chuàng)始人的李?lèi)鹜?,是公司的另一位技術(shù)大牛。專(zhuān)注于高性能計(jì)算、GPU加速領(lǐng)域的他,曾在2015年率領(lǐng)清華團(tuán)隊(duì)連獲世界三大超級(jí)計(jì)算機(jī)比賽的總冠軍。
此外,創(chuàng)業(yè)團(tuán)隊(duì)成員還包括“神威·太湖之光”Graph500作者林恒,國(guó)內(nèi)計(jì)算機(jī)領(lǐng)域的頂級(jí)專(zhuān)家、現(xiàn)為清華大學(xué)博導(dǎo)的陳文光教授,以及曾供職于交通部海事局和著名通訊設(shè)備商朗訊的VP崔明生等。其中,林恒博士基于“太湖之光”研發(fā)的“神圖”系統(tǒng)是世界上規(guī)模最大的圖計(jì)算系統(tǒng),能在36秒內(nèi)處理多達(dá)70萬(wàn)億邊的超大規(guī)模圖數(shù)據(jù)。
如今,這些技術(shù)精英都匯聚在費(fèi)馬科技的旗下。在費(fèi)馬科技現(xiàn)有18人的初創(chuàng)團(tuán)隊(duì)中,有13人是與技術(shù)相關(guān)的高級(jí)人才。
打造核心競(jìng)爭(zhēng)力
在洪春濤看來(lái),匯聚一流團(tuán)隊(duì)、打造一流產(chǎn)品并獲得客戶(hù)認(rèn)可才是打造核心競(jìng)爭(zhēng)力的關(guān)鍵。三年多的創(chuàng)業(yè)中,憑借硬核技術(shù),公司收獲了工商銀行、西門(mén)子、國(guó)家電網(wǎng)和京東金融等在內(nèi)的大型To B企業(yè)典型客戶(hù)。
據(jù)洪春濤介紹,目前費(fèi)馬科技聚焦的領(lǐng)域主要是圖計(jì)算領(lǐng)域的底層系統(tǒng)。在效率、資源的利用率和可用性比競(jìng)品都要好,是費(fèi)馬科技產(chǎn)品持續(xù)發(fā)力的關(guān)鍵點(diǎn)。
效率對(duì)于一個(gè)產(chǎn)品到底有多重要?洪春濤舉了一個(gè)例子。
“我們的競(jìng)品大約比競(jìng)品快100倍。這對(duì)用戶(hù)是一個(gè)很顯著的差別。對(duì)實(shí)時(shí)系統(tǒng)來(lái)說(shuō),它往往就意味著能不能做到實(shí)時(shí)響應(yīng)。實(shí)時(shí)系統(tǒng)一般要求是響應(yīng)時(shí)間不超過(guò)50毫秒。比如我們做個(gè)網(wǎng)上轉(zhuǎn)賬,50毫秒系統(tǒng)就應(yīng)該做過(guò)。那么假設(shè)有一個(gè)請(qǐng)求,用我們的系統(tǒng)來(lái)做需要50毫秒,用其它產(chǎn)品可能就需要5秒甚至更多。這時(shí)候就會(huì)出現(xiàn)明顯的差別:一個(gè)是“立等可取”,另一個(gè)就有明顯的等待時(shí)間。對(duì)于非實(shí)時(shí)系統(tǒng),100倍的性能差別往往就是“能做”和“不能做”的區(qū)別了?!焙榇簼f(shuō)道。
以反洗錢(qián)為例,洪春濤解釋?zhuān)瑢?duì)于銀行來(lái)說(shuō),一般都是每天跑一次。如果用費(fèi)馬科技的系統(tǒng),可能在1個(gè)小時(shí)就跑完了,第二天可以過(guò)來(lái)看下報(bào)告?!暗绻闷渌到y(tǒng)的話(huà),它可能需要100個(gè)小時(shí)甚至200小時(shí),這需要一個(gè)星期以后才能發(fā)現(xiàn)這個(gè)問(wèn)題。而此時(shí),嫌疑人可能都已經(jīng)跑掉了?!?/p>
進(jìn)一步豐富應(yīng)用場(chǎng)景
(圖為:費(fèi)馬科技產(chǎn)品圖)
據(jù)介紹,費(fèi)馬科技核心產(chǎn)品為費(fèi)馬LightGraph圖數(shù)據(jù)庫(kù)產(chǎn)品和費(fèi)馬PandaGraph圖計(jì)算產(chǎn)品,具備萬(wàn)億級(jí)別的圖數(shù)據(jù)分析能力,實(shí)現(xiàn)千萬(wàn)頂點(diǎn)每秒的查詢(xún)速度,提供超過(guò)25個(gè)內(nèi)置圖分析算法,同時(shí)可與Hadoop大數(shù)據(jù)平臺(tái)無(wú)縫結(jié)合,是超大規(guī)模數(shù)據(jù)關(guān)聯(lián)分析的絕佳平臺(tái)。
洪春濤表示,公司業(yè)務(wù)剛剛開(kāi)始發(fā)力,未來(lái)希望能將業(yè)務(wù)領(lǐng)域再往前推進(jìn)一步。除了要涵蓋現(xiàn)在需求量大的金融行業(yè),費(fèi)馬科技的業(yè)務(wù)領(lǐng)域還將拓展至工業(yè)領(lǐng)域、網(wǎng)絡(luò)安全以及公共安全等領(lǐng)域,進(jìn)一步豐富圖技術(shù)的應(yīng)用場(chǎng)景。
據(jù)其透露,2020年,費(fèi)馬科技除了在技術(shù)團(tuán)隊(duì)進(jìn)行必要的擴(kuò)容之外,代理商和銷(xiāo)售團(tuán)隊(duì)擴(kuò)容也在有序進(jìn)行當(dāng)中。
此前,費(fèi)馬科技已在2016年獲得了天使輪融資并在2018年3月完成來(lái)自京東金融的A輪融資。而在未來(lái),洪春濤希望能進(jìn)一步借助資本的力量,將技術(shù)優(yōu)勢(shì)保持領(lǐng)先地位。
“在未來(lái)圖計(jì)算領(lǐng)域的千億市場(chǎng)中,可能是一到兩家獨(dú)大,數(shù)十家共存的模式。”當(dāng)談及未來(lái)市場(chǎng)競(jìng)爭(zhēng)格局時(shí),洪春濤表示。(完)