本部要聞 來源:中譯語通日期:2025-09-04瀏覽次數(shù):340
2025年1月8日,美國(guó)司法部正式發(fā)布《防止受關(guān)注國(guó)家獲取美國(guó)敏感個(gè)人數(shù)據(jù)和政府相關(guān)數(shù)據(jù)的規(guī)定》,以落實(shí)美國(guó)前總統(tǒng)拜登于2024年2月28日簽發(fā)的第14117號(hào)行政令。該最終規(guī)則于2025年4月8日正式生效,限制或禁止美國(guó)敏感個(gè)人數(shù)據(jù)和政府?dāng)?shù)據(jù)流向中國(guó)、俄羅斯等六個(gè)受關(guān)注國(guó)家及其相關(guān)涵蓋主體。涉及的敏感數(shù)據(jù)包括六類:身份驗(yàn)證信息、個(gè)人財(cái)務(wù)信息、個(gè)人健康數(shù)據(jù)、生物識(shí)別數(shù)據(jù)、人類基因組數(shù)據(jù)與精準(zhǔn)地理位置信息。這意味著中美在科技與數(shù)據(jù)領(lǐng)域的脫鉤,正從“技術(shù)出口管制”進(jìn)一步延伸至“個(gè)人數(shù)據(jù)防火墻”的建立。
2024年諾貝爾化學(xué)獎(jiǎng)公布,一半共同授予德米斯·哈薩比斯和約翰·M·詹珀,“以表彰他們?cè)诘鞍踪|(zhì)結(jié)構(gòu)預(yù)測(cè)方面的成就”;另一半則授予大衛(wèi)·貝克,“以表彰在計(jì)算蛋白質(zhì)設(shè)計(jì)方面的貢獻(xiàn)”。基于龐大的生物信息數(shù)據(jù),在大模型與超級(jí)算力的支撐下,基因測(cè)序分析、基因突變識(shí)別、藥物特性預(yù)測(cè)、靶點(diǎn)和藥物發(fā)現(xiàn)、臨床前實(shí)驗(yàn)設(shè)計(jì)、老藥新用等多個(gè)方向的研究獲得了極大提升。
美國(guó)衛(wèi)星公司MAXAR拍攝了0.3m精度的伊朗福爾多核設(shè)施圖像,該設(shè)施曾被美國(guó)B-2轟炸機(jī)打擊。此外,合成孔徑雷達(dá)還拍攝了伊朗納塔茲核設(shè)施的衛(wèi)星圖像。在伊以沖突中,美西方在高精度的衛(wèi)星數(shù)據(jù)支撐下實(shí)現(xiàn)戰(zhàn)場(chǎng)上的“單向透明”。Airbus公司也通過0.3m精度衛(wèi)星拍攝了位于智利的太空望遠(yuǎn)鏡高清圖像。這些案例體現(xiàn)出,地理空間數(shù)據(jù)在國(guó)防軍事、國(guó)家安全、應(yīng)急救援、智慧城市等諸多領(lǐng)域具有廣泛而重要的應(yīng)用潛力。
根據(jù)新摩爾定律,互聯(lián)網(wǎng)數(shù)據(jù)總量每12個(gè)月翻一倍。而AI智能體的超級(jí)摩爾定律,在過去的六年中,其完成任務(wù)能力每7個(gè)月就會(huì)提升一倍。預(yù)計(jì)未來幾年,這一增速還將以更驚人的幅度持續(xù)提升。中譯語通就是一家每日與這些數(shù)據(jù)、相關(guān)機(jī)構(gòu)、這些領(lǐng)域的用戶深度合作,并已連續(xù)四次被美國(guó)國(guó)防部列入“中國(guó)涉軍企業(yè)”的大數(shù)據(jù)和人工智能的企業(yè)。
2023年,美國(guó)防部發(fā)布《國(guó)防部數(shù)據(jù)戰(zhàn)略》,明確將數(shù)據(jù)定位為戰(zhàn)略資產(chǎn),提出“使國(guó)防部成為以數(shù)據(jù)為中心的機(jī)構(gòu),通過智能計(jì)算資源快速、規(guī)?;厥褂脭?shù)據(jù),以獲取作戰(zhàn)優(yōu)勢(shì)和提高效率”的發(fā)展愿景。2025年7月23日美國(guó)白宮發(fā)布《贏得競(jìng)賽:美國(guó)人工智能行動(dòng)計(jì)劃》,提出“美國(guó)將主導(dǎo)建設(shè)全球最大、質(zhì)量最高的人工智能適用科學(xué)數(shù)據(jù)集,以加快構(gòu)建美國(guó)人工智能的競(jìng)爭(zhēng)優(yōu)勢(shì)”。 毋庸置疑,數(shù)據(jù)是戰(zhàn)略資產(chǎn),是增強(qiáng)作戰(zhàn)準(zhǔn)備度的戰(zhàn)略資產(chǎn),是增強(qiáng)科技研發(fā)效率的戰(zhàn)略資產(chǎn),是加速新藥創(chuàng)新的戰(zhàn)略資產(chǎn)。數(shù)據(jù)也是戰(zhàn)略武器。戰(zhàn)略數(shù)據(jù)已經(jīng)成為大國(guó)博弈的新疆域,關(guān)乎國(guó)家安全。高質(zhì)量的戰(zhàn)略數(shù)據(jù)資源,也將重構(gòu)大國(guó)間人工智能競(jìng)爭(zhēng)的格局。在此背景下,我們應(yīng)高度重視并加快推進(jìn)中國(guó)自主的戰(zhàn)略數(shù)據(jù)儲(chǔ)備體系建設(shè)。
在這種復(fù)雜的國(guó)際博弈環(huán)境下,我們主張建立認(rèn)知主權(quán)下的全球數(shù)據(jù)戰(zhàn)略與安全新范式——即在尊重各國(guó)數(shù)據(jù)主權(quán)的前提下,通過自主、安全、深入地理解與運(yùn)用跨域數(shù)據(jù),構(gòu)建決策智能新范式,以應(yīng)對(duì)數(shù)據(jù)跨境流動(dòng)、主權(quán)爭(zhēng)議和安全威脅等日益嚴(yán)峻的問題,真正使數(shù)據(jù)成為國(guó)家競(jìng)爭(zhēng)力、企業(yè)價(jià)值與個(gè)體權(quán)益的核心要素。
2015年中譯語通就提出了“跨語言大數(shù)據(jù)”的概念。這也是該詞匯首次在互聯(lián)網(wǎng)上出現(xiàn)。歷經(jīng)十余年發(fā)展,我們逐步構(gòu)建起從數(shù)據(jù)采集到可視化分析,從數(shù)據(jù)分析到知識(shí)圖譜、從機(jī)器翻譯到語音識(shí)別、從計(jì)算機(jī)視覺到AIGC、從大模型再到智能體的全棧技術(shù)與數(shù)據(jù)能力。我們努力跨越語言障礙,探尋數(shù)據(jù)的關(guān)聯(lián),在多模態(tài)數(shù)據(jù)中尋找復(fù)雜數(shù)據(jù)世界的邏輯。認(rèn)識(shí)到,復(fù)雜數(shù)據(jù)問題本質(zhì)上是治理問題,不是技術(shù)問題。
在數(shù)據(jù)能力方面,這些年來,我們已經(jīng)形成了千億級(jí)高質(zhì)量數(shù)據(jù)集、覆蓋全球200多個(gè)國(guó)家或地區(qū)、120種語言,超過200萬獨(dú)立數(shù)據(jù)源的數(shù)據(jù)挖掘能力?;诖竽P图夹g(shù),我們還形成了將數(shù)據(jù)轉(zhuǎn)化為可理解、可推理的語義網(wǎng)絡(luò)的能力,發(fā)布了“格物”大模型。在昨日召開的“國(guó)防科技智能體應(yīng)用研討會(huì)”閉門會(huì)議上,我們正式發(fā)布了GTCOM AIP平臺(tái)。該平臺(tái)是一個(gè)驅(qū)動(dòng)大模型進(jìn)化、賦能智能體協(xié)同的動(dòng)態(tài)、可計(jì)算、可演化的認(rèn)知系統(tǒng)和數(shù)據(jù)融合中臺(tái),通過為人工智能賦予“知識(shí)”與“規(guī)則”,使其認(rèn)知和行為變得可解釋、可控制和可互操作。
掌握數(shù)據(jù)主權(quán)的關(guān)鍵并非數(shù)據(jù)本身,而在于數(shù)據(jù)處理和應(yīng)用的核心“大腦中樞”,即大模型驅(qū)動(dòng)能力。當(dāng)前,僅依賴數(shù)據(jù)訓(xùn)練的大模型仍面臨幻覺頻出、認(rèn)知層次淺、復(fù)雜任務(wù)執(zhí)行成功率低等問題。因此,我們需要一個(gè)新的認(rèn)知層來為AI提供結(jié)構(gòu)化的世界模型。具體可以總結(jié)為認(rèn)知感知與萃取層、本體構(gòu)建與演化層、智能體賦能與協(xié)同層三個(gè)層次。認(rèn)知感知與萃取層負(fù)責(zé)精準(zhǔn)抽取實(shí)體、關(guān)系、事件、動(dòng)作等核心本體要素,破除語言與語義壁壘,并解析圖像、音頻、視頻中的多模態(tài)信息,將其對(duì)齊至統(tǒng)一的語義本體表征空間,從而產(chǎn)出源源不斷的、經(jīng)過初步結(jié)構(gòu)化的“認(rèn)知流”。接收到“認(rèn)知流”后,大模型動(dòng)態(tài)驅(qū)動(dòng)構(gòu)建、維護(hù)和演化全局知識(shí)網(wǎng)絡(luò),即本體,進(jìn)而形成一個(gè)活的、持續(xù)成長(zhǎng)的結(jié)構(gòu)化世界模型,成為所有推理與交互的“事實(shí)來源”。最后,將本體作為“行動(dòng)綱領(lǐng)”,為每個(gè)智能體注入本體知識(shí),定義復(fù)雜的任務(wù)流程和智能體角色,自動(dòng)觸發(fā)并協(xié)調(diào)多個(gè)智能體協(xié)同完成一項(xiàng)宏任務(wù)。我們努力地在“高質(zhì)量數(shù)據(jù)集+本體+大模型+智能體”深度融合的基礎(chǔ)上,構(gòu)建可信任、可解釋、可協(xié)同的智能體生態(tài)。
當(dāng)我們擁有高質(zhì)量的數(shù)據(jù)集和戰(zhàn)略數(shù)據(jù)儲(chǔ)備,建立起可信數(shù)據(jù)空間,有了高性能的智能體之后,我們?nèi)孕枨逍训卣J(rèn)識(shí)到:數(shù)據(jù)的價(jià)值在于流動(dòng)。除了中文數(shù)據(jù),還有規(guī)模更為龐大的全球數(shù)據(jù)。例如,在大宗貨品交易中計(jì)算大豆數(shù)據(jù)時(shí),我們不僅需要中國(guó)的數(shù)據(jù),還需要美國(guó)、巴西、澳大利亞等多國(guó)數(shù)據(jù)的支撐。當(dāng)我們進(jìn)行生命科學(xué)和藥物研究的時(shí)候,中國(guó)以外的數(shù)據(jù)我們還缺少很多很多。寶貴的高質(zhì)量數(shù)據(jù)資源是中國(guó)的是世界的。我們應(yīng)在“一帶一路”框架下積極推進(jìn)“全球可信數(shù)據(jù)空間”建設(shè),踐行認(rèn)知主權(quán)新范式,不斷提升我國(guó)在全球數(shù)據(jù)治理中的話語權(quán)。
在全球數(shù)據(jù)戰(zhàn)略及安全新范式下,我們應(yīng)在各參與方的數(shù)據(jù)源之上,共同構(gòu)建一個(gè)關(guān)于“深度應(yīng)用”的認(rèn)知本體。該本體以跨語言、跨標(biāo)準(zhǔn)的方式,明確定義每一項(xiàng)關(guān)鍵里程碑指標(biāo),如同為使用不同語言的人士提供一個(gè)通用的“世界語”來討論專業(yè)問題。我們倡導(dǎo)“可信計(jì)算”而非簡(jiǎn)單數(shù)據(jù)共享。例如,不同區(qū)域的模型算法可通過平臺(tái)以加密查詢的方式,“請(qǐng)教”位于其他區(qū)域的本體層。系統(tǒng)在本地執(zhí)行計(jì)算,將脫敏后的模型參數(shù)或統(tǒng)計(jì)結(jié)果安全地返回給請(qǐng)求的系統(tǒng)。整個(gè)過程確保原始數(shù)據(jù)不出域,實(shí)現(xiàn)“可用不可見”,完全符合數(shù)據(jù)主權(quán)的規(guī)定。我們推行“智能治理”而非人工標(biāo)注。所有數(shù)據(jù)交互行為均被本體自動(dòng)記錄,形成不可篡改的數(shù)據(jù)血緣。監(jiān)管機(jī)構(gòu)可隨時(shí)審計(jì),確保每一次數(shù)據(jù)訪問都符合預(yù)設(shè)治理規(guī)則。這各機(jī)制為建立跨國(guó)間的監(jiān)管互信提供了堅(jiān)實(shí)的技術(shù)基礎(chǔ)。
我們倡議在“認(rèn)知主權(quán)”與“全球數(shù)據(jù)信任之網(wǎng)”的理念下,共同建設(shè)數(shù)據(jù)信任生態(tài)的發(fā)展愿景。在“一帶一路”框架下,我們?cè)敢浴癎TCOM AIP”的能力為基礎(chǔ),與全球的開發(fā)者、標(biāo)準(zhǔn)化組織及企業(yè)開展合作,共同定義并豐富各個(gè)行業(yè)的“認(rèn)知本體”。從國(guó)防工業(yè)到金融風(fēng)控,從供應(yīng)鏈韌性到智慧城市,從新藥研發(fā)到地理空間研究,我們通過編織一張張垂直領(lǐng)域的“信任之網(wǎng)”,應(yīng)對(duì)全球性挑戰(zhàn),為全球數(shù)字經(jīng)濟(jì)發(fā)展貢獻(xiàn)中國(guó)智慧與中國(guó)技術(shù)。