生成式人工智能安全
Large language model based on sentence granularity prompts for temporal knowledge Q&A approach
李志東,羅琪彬,喬思龍
doi: 10.19358/j.issn.2097-1788.2023.12.002
知識(shí)問答是自然語言處理領(lǐng)域的研究熱點(diǎn)之一,而時(shí)序知識(shí)問答還需考慮知識(shí)的時(shí)序關(guān)系,更是研究難點(diǎn)所在。當(dāng)前時(shí)序知識(shí)問答方法通常將知識(shí)和問題的詞向量相似度作為回答的重要依據(jù),忽略了知識(shí)所蘊(yùn)含的句粒度語義信息。對此,提出了一種基于句粒度提示的大語言模型時(shí)序知識(shí)問答方法,首先通過對句粒度提示的改進(jìn),讓大語言模型高效學(xué)習(xí)句粒度語義信息,同時(shí)驗(yàn)證大語言模型在Zeroshot、Fewshot及弱監(jiān)督微調(diào)下時(shí)序知識(shí)問答能力。在ICEWS0515數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),所提方法回答正確準(zhǔn)確率得到可觀提升,體現(xiàn)了基于句粒度提示的大語言模型時(shí)序知識(shí)問答方法的有效性。
Intelligent chaoqing based on large models: event key point extraction and report generation
曾文龍1,劉丹2,張超1
doi: 10.19358/j.issn.2097-1788.2023.12.004
隨著信息爆炸時(shí)代的到來,如何利用抄清手段高效地從海量數(shù)據(jù)中提取有價(jià)值的信息并生成準(zhǔn)確的抄清報(bào)告成為了情報(bào)分析和推理領(lǐng)域的重要挑戰(zhàn)。傳統(tǒng)的手動(dòng)抄清方法難以應(yīng)對數(shù)據(jù)量龐大、多樣性高的情報(bào)數(shù)據(jù),因此需要借助自然語言技術(shù)提升抄清分析效率和準(zhǔn)確性。提出了一種基于大模型的智能抄清方法,旨在通過事件要點(diǎn)抽取和報(bào)告生成,實(shí)現(xiàn)高效、準(zhǔn)確和可靠的情報(bào)分析和推理。該方法利用自然語言處理技術(shù)對抄清數(shù)據(jù)進(jìn)行分析,結(jié)合語法及語義信息進(jìn)行文檔事件要點(diǎn)信息抽取,基于大模型的生成能力,生成全面且內(nèi)容豐富的抄清報(bào)告。
Copyright protection for deep learning models utilizing a black box testing framework
屈詳顏1,2,于靜1,2,熊剛1,2,蓋珂珂3
doi: 10.19358/j.issn.2097-1788.2023.12.001
當(dāng)前生成式人工智能技術(shù)迅速發(fā)展,深度學(xué)習(xí)模型作為關(guān)鍵技術(shù)資產(chǎn)的版權(quán)保護(hù)變得越發(fā)重要。現(xiàn)有模型版權(quán)保護(hù)方法一般采用確定性測試樣本生成算法,存在選擇效率低和對抗攻擊脆弱的問題。針對上述問題,提出了一種基于黑盒測試框架的深度學(xué)習(xí)模型版權(quán)保護(hù)方法。首先引入基于隨機(jī)性算法的樣本生成策略,有效提高了測試效率并降低了對抗攻擊的風(fēng)險(xiǎn)。此外針對黑盒場景,引入了新的測試指標(biāo)和算法,增強(qiáng)了黑盒防御的能力,確保每個(gè)指標(biāo)具有足夠的正交性。在實(shí)驗(yàn)驗(yàn)證方面,所提方法顯示出了高效的版權(quán)判斷準(zhǔn)確性和可靠性,有效降低了高相關(guān)性指標(biāo)的數(shù)量。
Research on gradient optimization based backdoor identification of large language model
陳佳華1,陳宇2,曹婍3
doi: 10.19358/j.issn.2097-1788.2023.12.003
隨著大語言模型的流行并且應(yīng)用在越來越多的領(lǐng)域,大語言模型的安全問題也隨之而來。 通常訓(xùn)練大語言模型對數(shù)據(jù)集以及計(jì)算資源有著極為苛刻的要求,所以有使用需求的用戶大部分都直接利用網(wǎng)絡(luò)上開源的數(shù)據(jù)集以及模型,這給后門攻擊提供了絕佳的溫室。后門攻擊是指用戶在模型中輸入正常數(shù)據(jù)時(shí)模型表現(xiàn)像沒有注入后門時(shí)一樣正常,但當(dāng)輸入帶有后門觸發(fā)器的數(shù)據(jù)時(shí)模型輸出異常。防止后門攻擊的有效方法就是進(jìn)行后門識(shí)別。目前基于梯度的優(yōu)化方法是比較常用的,但使用這些方法時(shí)內(nèi)部影響因子的設(shè)定對識(shí)別效果具有一定影響。文章就詞令牌數(shù)量、最鄰近數(shù)量、噪聲大小進(jìn)行了實(shí)驗(yàn)測量和作用機(jī)制的分析,以便為后續(xù)使用這些方法的研究者提供參考。
Data security risks of generative large model and its legal governance
劉羿鳴1,林梓瀚2
doi: 10.19358/j.issn.2097-1788.2023.12.005
生成式大模型具有廣泛的應(yīng)用前景。大模型的訓(xùn)練和運(yùn)行均需要海量數(shù)據(jù)的支撐,極有可能引發(fā)數(shù)據(jù)安全風(fēng)險(xiǎn)。認(rèn)知風(fēng)險(xiǎn)是化解風(fēng)險(xiǎn)的前提,需要從靜態(tài)、動(dòng)態(tài)兩個(gè)視角建立起大模型應(yīng)用數(shù)據(jù)安全風(fēng)險(xiǎn)的認(rèn)知體系。結(jié)合歐盟、美國等大模型的治理經(jīng)驗(yàn),針對我國大模型數(shù)據(jù)安全風(fēng)險(xiǎn)治理存在的不足,建議建立基于數(shù)據(jù)安全風(fēng)險(xiǎn)的分類監(jiān)管路徑、完善基于大模型運(yùn)行全過程的數(shù)據(jù)安全責(zé)任制度、探索基于包容審慎監(jiān)管的創(chuàng)新監(jiān)管機(jī)制,為實(shí)現(xiàn)大模型應(yīng)用的可信未來提供充分的法治保障。
網(wǎng)絡(luò)與信息安全
TOR anonymity network traffic recognition method integrating protocol information fusion
楊剛1,姜舟1,張嬌婷1,汪俊永1,王強(qiáng)2,3,張研1
doi: 10.19358/j.issn.2097-1788.2023.12.007
TOR(The Onion Router)匿名網(wǎng)絡(luò)流量識(shí)別是一項(xiàng)重要的加密流量檢測任務(wù),隨著TOR混淆模式的迭代更新,引入OBFS4(ObjectBased File System4)混淆協(xié)議后對TOR的檢測較為困難。詳細(xì)研究了TOR行為和混淆協(xié)議特性,將關(guān)鍵行為特征與OBFS4混淆協(xié)議特征進(jìn)行融合,增強(qiáng)了面向混淆協(xié)議的TOR流量的檢出能力。另外構(gòu)造了包含瀏覽網(wǎng)頁、視頻直播、聊天等多業(yè)務(wù)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。結(jié)果顯示,該研究方法在基于OBFS4混淆協(xié)議的TOR流量檢測任務(wù)上效果顯著,其中l(wèi)ightGBM模型檢測效果最佳,在融合協(xié)議特征的方法下準(zhǔn)確率達(dá)到9889%。同時(shí)該方法面向不同版本的TOR流量開展復(fù)測,在不同版本的TOR流量檢測任務(wù)中準(zhǔn)確率均高于97%。
Internet of Things security posture prediction based on ADE ABiGRU
彭興維1,袁凌云1,2
doi: 10.19358/j.issn.2097-1788.2023.12.008
針對物聯(lián)網(wǎng)安全態(tài)勢預(yù)測的復(fù)雜性和多變性,提出一種基于ADEABiGRU的物聯(lián)網(wǎng)安全態(tài)勢預(yù)測模型。該模型融合了雙向門控循環(huán)單元、多頭注意力機(jī)制和殘差結(jié)構(gòu),并經(jīng)由自適應(yīng)差分進(jìn)化算法調(diào)優(yōu),增強(qiáng)了對復(fù)雜時(shí)序依賴性的捕捉和對數(shù)據(jù)的多維度分析能力。通過改進(jìn)自適應(yīng)差分進(jìn)化算法的自適應(yīng)機(jī)制,充分考慮時(shí)序數(shù)據(jù)特征,以提升全局搜索效率和局部逼近精度。在ToN_IoT數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)算法相比,該模型在MAPE、R2和MSE上均表現(xiàn)出色,展現(xiàn)出更高的預(yù)測準(zhǔn)確性和穩(wěn)定性。
A systems thinking for cybersecurity modeling
嚴(yán)定宇,張宇鵬,陸希玉,曹華平
doi: 10.19358/j.issn.2097-1788.2023.12.006
解決網(wǎng)絡(luò)空間安全問題需要對網(wǎng)絡(luò)空間中的組成部分、因素、結(jié)構(gòu)及其相互作用有一個(gè)整體性的理解,但傳統(tǒng)式建模方法更注重技術(shù)性問題,缺乏從宏觀的視角看待網(wǎng)絡(luò)空間安全。嘗試討論把系統(tǒng)思維方式應(yīng)用到網(wǎng)絡(luò)空間安全的建模上。首先回顧了系統(tǒng)思維方式,列舉了網(wǎng)絡(luò)空間中與安全相關(guān)的領(lǐng)域、組成部分、影響因素以及它們間的交互情況。其次,針對網(wǎng)絡(luò)空間安全建模的困難與挑戰(zhàn),對能夠解決相關(guān)問題的系統(tǒng)理論與方法進(jìn)行了舉例。最后,提出了一個(gè)針對網(wǎng)絡(luò)空間安全建模的系統(tǒng)思維框架,涵蓋了方法論、理論、技術(shù)和實(shí)踐等內(nèi)容。該研究認(rèn)為系統(tǒng)思維是開展網(wǎng)絡(luò)空間安全建模的重要工具之一,幫助研究人員和從業(yè)人員去探索、刻畫、理解、評估及預(yù)測網(wǎng)絡(luò)空間安全相關(guān)的內(nèi)容。
數(shù)據(jù)安全
A data security sharing and interaction framework based on privacy computing technology
張鵬1,李美鵬1,郭兆中2,劉文杰1,孫立群1
doi: 10.19358/j.issn.2097-1788.2023.12.009
隱私計(jì)算作為一種數(shù)據(jù)安全交互解決手段,是由兩個(gè)或多個(gè)參與方聯(lián)合計(jì)算的技術(shù)和系統(tǒng),參與方可以在不泄露各自數(shù)據(jù)的前提下通過協(xié)作對數(shù)據(jù)進(jìn)行聯(lián)合機(jī)器學(xué)習(xí)和分析,隱私計(jì)算可實(shí)現(xiàn)“數(shù)據(jù)可用不可見”“數(shù)據(jù)不動(dòng)模型動(dòng)”,具備強(qiáng)化數(shù)據(jù)安全合規(guī)性、確保隱私數(shù)據(jù)不泄露的能力,可以說是現(xiàn)階段數(shù)據(jù)安全交互與敏感信息保護(hù)的“最優(yōu)解”。圍繞數(shù)據(jù)安全共享與協(xié)同應(yīng)用,提出基于隱私計(jì)算技術(shù)的共享交互框架設(shè)計(jì)方案,結(jié)合業(yè)務(wù)實(shí)際分別給出技術(shù)架構(gòu)和邏輯架構(gòu)設(shè)計(jì),分析關(guān)鍵技術(shù)和利弊,為數(shù)據(jù)的安全交互和開發(fā)利用提供解決思路。
Research of data security based on cybersecurity classified protection
李尚號(hào),王勇
doi: 10.19358/j.issn.2097-1788.2023.12.011
通過深度剖析網(wǎng)絡(luò)安全和數(shù)據(jù)安全的內(nèi)在聯(lián)系,探討將數(shù)據(jù)安全保護(hù)納入網(wǎng)絡(luò)安全等級保護(hù)工作流程的必要性與可行性,提出具體的工作步驟與實(shí)施過程。在落實(shí)等級保護(hù)的基礎(chǔ)上,有序推進(jìn)數(shù)據(jù)安全保護(hù),快速、有效、體系化地開展數(shù)據(jù)安全保護(hù)工作,實(shí)現(xiàn)網(wǎng)絡(luò)基礎(chǔ)設(shè)施安全和上層業(yè)務(wù)數(shù)據(jù)安全一體的真正數(shù)據(jù)安全。
High concurrency and reliable access method for massive heterogeneous data based on dynamic balancing technology
趙勛,周成勝,靳文京,劉曉曼,王桂溫
doi: 10.19358/j.issn.2097-1788.2023.12.010
隨著大數(shù)據(jù)時(shí)代的到來,海量異構(gòu)數(shù)據(jù)的高并發(fā)可靠接入成為了一個(gè)亟待解決的問題。提出了一種基于動(dòng)態(tài)均衡技術(shù)的海量異構(gòu)數(shù)據(jù)高并發(fā)可靠接入方法。該方法采用去中心化的任務(wù)分配機(jī)制實(shí)現(xiàn)海量數(shù)據(jù)源接入;針對各類異構(gòu)數(shù)據(jù)源設(shè)計(jì)了基于HTTPS、SFTP、Kafka等多樣化采集手段及相應(yīng)的節(jié)點(diǎn)分配和回收機(jī)制;采用動(dòng)態(tài)負(fù)載均衡策略對采集資源進(jìn)行實(shí)時(shí)調(diào)整,以適應(yīng)不斷變化的數(shù)據(jù)負(fù)載,實(shí)現(xiàn)高并發(fā)處理。該研究為實(shí)現(xiàn)海量異構(gòu)數(shù)據(jù)的高效、可靠接入提供了一種有效的解決方法。
數(shù)據(jù)治理
Data altruism: a new concept of data governance in the EU and its implications
張藝洋
doi: 10.19358/j.issn.2097-1788.2023.12.012
歐盟數(shù)據(jù)治理法(DGA)的正式出臺(tái)標(biāo)志著歐盟數(shù)據(jù)治理模式開始轉(zhuǎn)型。該法的重心在于通過貫徹利他主義這一核心理念來強(qiáng)化公共數(shù)據(jù)的再利用。利他主義作為一種新的數(shù)據(jù)治理理念,對之進(jìn)行系統(tǒng)分析,有利于為我國數(shù)據(jù)治理所借鑒利用。首先梳理歐盟數(shù)據(jù)治理歷程和邏輯框架,數(shù)據(jù)利他主義是發(fā)展到現(xiàn)數(shù)據(jù)共享階段的必然結(jié)果,分析數(shù)據(jù)利他主義治理的概念及其特點(diǎn)、其指導(dǎo)下的數(shù)據(jù)治理模式,如公共機(jī)構(gòu)部門共享模式和數(shù)據(jù)中介共享模式。進(jìn)而對DGA尤其是該法貫徹的利他理念進(jìn)行評析,在此基礎(chǔ)上為我國數(shù)據(jù)治理提出借鑒思路。我國宜從發(fā)展數(shù)據(jù)利他主義理念、引入多元數(shù)據(jù)共享主體和完善數(shù)據(jù)共享立法體系的角度對之加以借鑒。
Study of the requirements, methods and strategies for intranet sensitive big data exchanging between various networks or network areas
李祺睿1,2,蔣晶晶2,張加洪2
doi: 10.19358/j.issn.2097-1788.2023.12.013
針對內(nèi)網(wǎng)敏感大數(shù)據(jù)治理和應(yīng)用,分析闡述了數(shù)據(jù)采集報(bào)送、引接匯聚、分發(fā)共享、綜合應(yīng)用過程中跨網(wǎng)域跨密區(qū)數(shù)據(jù)流轉(zhuǎn)和信息交互需求,對比研究了各類跨網(wǎng)域跨密區(qū)數(shù)據(jù)交換技術(shù)方法,并提出了面向應(yīng)用需求實(shí)現(xiàn)跨網(wǎng)域跨密區(qū)數(shù)據(jù)交換的方法策略,為內(nèi)網(wǎng)大數(shù)據(jù)建設(shè)運(yùn)用提供技術(shù)支持和策略建議。
網(wǎng)絡(luò)與通信
Design and implementation of a elastic self organizing multi cluster management system
夏令明, 周俊,趙鋒
doi: 10.19358/j.issn.2097-1788.2023.12.014
Kubernetes等云原生技術(shù)在業(yè)界應(yīng)用時(shí),承載能力有限,無法滿足更高可用性要求,且易被云供應(yīng)商鎖定;東數(shù)西算等戰(zhàn)略的實(shí)施運(yùn)行,需以多集群管理技術(shù)為基礎(chǔ),但是傳統(tǒng)的云管平臺(tái)難以滿足跨多云應(yīng)用的服務(wù)部署和治理的挑戰(zhàn)。提出軟件定義的自組織基礎(chǔ)設(shè)施管理、冪等的分層調(diào)度新理念,實(shí)現(xiàn)以集群為最小單位的彈性基礎(chǔ)設(shè)施管理架構(gòu),將多個(gè)Kubernetes集群組成中心式、去中心式、樹狀等任意拓?fù)浣Y(jié)構(gòu),進(jìn)行應(yīng)用的跨云調(diào)度及管理。方案基于樹狀集群結(jié)構(gòu)進(jìn)行了測試驗(yàn)證,并與其他方案對比,測試結(jié)果表明該方案能夠滿足未來分布式云場景下海量集群組織管理需求,且保持接入新集群不超過1 s,應(yīng)用的調(diào)度延遲不超過200 ms。
行業(yè)應(yīng)用
Design and implementation of the 3D visualization system for target and situation
楊垚,劉永海,肖雅娟,卞泊
doi: 10.19358/j.issn.2097-1788.2023.12.015
為提升大規(guī)模數(shù)據(jù)下態(tài)勢展示的性能和效果,對態(tài)勢展示的關(guān)鍵技術(shù)進(jìn)行研究,設(shè)計(jì)并實(shí)現(xiàn)了實(shí)時(shí)態(tài)勢監(jiān)控、歷史態(tài)勢回放、目標(biāo)三維可視化等功能的系統(tǒng)。該系統(tǒng)利用數(shù)據(jù)清洗、數(shù)據(jù)插值和數(shù)據(jù)融合等技術(shù)對多源異構(gòu)態(tài)勢數(shù)據(jù)進(jìn)行實(shí)時(shí)處理;然后將處理后的數(shù)據(jù)儲(chǔ)存于多級數(shù)據(jù)存儲(chǔ)系統(tǒng)中,通過緩存和批量數(shù)據(jù)獲取機(jī)制提升數(shù)據(jù)加載效率;最后,基于瀏覽器和GIS服務(wù)實(shí)現(xiàn)目標(biāo)與態(tài)勢的三維地理空間可視化。仿真結(jié)果表明,該系統(tǒng)態(tài)勢數(shù)據(jù)獲取快速高效,態(tài)勢展示效果立體清晰,能夠滿足大型模擬對抗演習(xí)中的目標(biāo)分析、態(tài)勢監(jiān)控和回放需求。