主題專欄:城市數據治理
Research on the logic and realization path of data circulation led by data subject
陸志鵬
doi: 10.20044/j.csdg.2097-1788.2022.01.001
數據上升為全新的生產要素,發展數據要素市場、激活數據要素潛能成為全球各國在數字時代搶占競爭優勢的關鍵抓手,但數據資源分散、流通壁壘林立,共享、開放以及交易等流通路徑面臨諸多困境難以破題,數據流通的長效機制研究亟待建立。通過深度剖析數據控制主體主導的數據流通體系,分析其面臨的困境及內在原因,充分借鑒全球各國對數據流通新路徑的探索與實踐經驗,提出了數據主體主導的數據流通新路徑,包括設計思路、基礎與支撐、實施路徑以及效益分析,為數據流通機制探索與模式創新提供參考。
Information pricing and trading:an application of dimensional model
李心宓1,吳 謠2,高 峰2
doi: 10.20044/j.csdg.2097-1788.2022.01.002
構建了一個具有多維信息的模型,用于分析信息定價和交易,并根據模型討論了均衡性質。分析結果表明,信息的公開可以增加社會福利。但若信息可以自由交易,市場參與者可能偏好不公開信息,此時社會福利可能受損。在信息定價方面,證明了在秘密信息交易中不對稱信息可能給不道德的信息賣方帶來額外的收入,這為信息立法方面的司法實踐提供參考。
Research on data classification and grading and its development path
張 敏,魏 偉,譚天怡,何 軼
doi: 10.20044/j.csdg.2097-1788.2022.01.003
數據分類分級管理是推動數據要素化發展工作的重要步驟之一。對美國、英國政府數據分類分級管理現狀開展研究,為我國數據分類分級管理工作提供借鑒。同時,從實際出發,對國內政府數據、公共數據、行業數據等分類分級工作進行梳理分析,總結得出目前仍存在數據分類分級工作標準不統一、核心數據和重要數據識別不清晰、行業對數據分類分級工作缺少深層認識等問題,并提出我國需要進一步完善數據分類分級的法律法規體系,健全政府數據分類分級管理組織體系,推進核心數據和重要數據的管理工作,加快研發數據分類分級的智能化工具,以此加快推進我國數據分類分級工作的開展與落實。
Research on supervising-oriented data checking mechanism: an analogical analysis perspective on production factors
張 楠1,2,周 亮1,刁 玉1
doi: 10.20044/j.csdg.2097-1788.2022.01.004
在數據作為生產要素價值釋放的進程中,監管導向的數據稽查是兼顧數據增值的數據安全保障。然而,數據稽查的概念內涵、基本原則和實施方式還亟待討論。對比土地、勞動力、資本、技術等傳統生產要素治理過程中的監管模式和稽查手段,數據要素的共性和特性決定了數據稽查應具有方式具體、事后追究、對象明確和技術依賴的特征。在此基礎上形成的數據稽查機制架構包括宏觀與微觀兩個層面,嵌入數據價值產生的過程,對數據稽查機制的進一步研究奠定了基礎。
Preliminary exploration on the construction of the metaverse legal system and data governance
胡 洋,洪 晟
doi: 10.20044/j.csdg.2097-1788.2022.01.006
2021年,元宇宙熱度持續上漲。目前元宇宙相關概念、標準尚未正式形成,底層技術不夠成熟,立法監管空白,法制體系建設任務艱巨。對于交易在數據鏈上的元宇宙來說,數據治理問題更是其中不容忽視的一環。在此背景下,對元宇宙概念、相關技術和法律法規的研究現狀進行了分析,聚焦于元宇宙規則制定、責任主體確認、財產與交易、數據治理、犯罪治理等方面的核心法律問題。在未來,依托整個社會的有機配合,技術、法律、資本的共同支撐,元宇宙極有可能成為一個新的發展方向。
Research on legal regulation of the Big Data affinity
田 蕾,洪 晟
doi: 10.20044/j.csdg.2097-1788.2022.01.007
隨著大數據技術發展,“大數據殺熟”現象日益嚴重,侵害了消費者的諸多合法權益。針對該現象,在充分研究了其成因和目前規制困境的基礎上,提出了完善相關法律規制的建議,使大數據能夠更好地發揮其應有價值,有助于在互聯網平臺利益與消費者合法權益保護之間找到平衡點。
Exploration of public data authorization operation mechanism
陸志鵬
doi: 10.20044/j.csdg.2097-1788.2022.01.005
數字經濟飛速發展帶來了公共數據體量的劇增。公共數據作為數據要素市場的重要資源,對于以授權運營為主要手段的公共數據開展增值性開發利用已成為普遍共識。但現實是,一方面,公共數據授權運營的法律邏輯尚未厘清,公共數據授權運營與公共數據承載的公共價值存在一定的沖突和背離;另一方面現有公共數據授權運營模式或帶來數據集中壟斷的風險或不能充分釋放數據融合應用所帶來的巨大價值。為此創新性地提出以數據元件為流通形態的新型公共數據授權運營路徑,在避免數據壟斷風險的同時,兼顧大規模交叉場景的應用,為公共數據的使用,真正服務于經濟的高質量發展和共同富裕提供有益探索。
綜述與評論
Hotspots analysis of sentiment research on Internet public opinion in China
張 楊1,廉吉慶2,張 揚1,高德毅3
doi: 10.20044/j.csdg.2097-1788.2022.01.008
以中國知網收錄的網絡輿情情感分析主題論文為數據來源,以文章摘要為詞源,借助TF-IDF方法提取關鍵詞并對關鍵詞進行共詞分析。結果顯示,目前國內網絡輿情情感研究熱點包括對輿情信息內容進行情感分析,對情感分析技術進行改進和創新,對輿情傳播過程中的各個要素進行情感分析等方面。所使用的共詞分析方法可以反映單個關鍵詞的熱門程度,對網絡輿情的科學分析和有效應對提供了理論指導,具有重要的參考價值。
網絡與信息安全
A rumor propagation model in the context of recommendation
吳日銘1,韓益亮1,郭凱陽1,李永斌2
doi: 10.20044/j.csdg.2097-1788.2022.01.009
隨著信息傳播方式的改變,通過信息推薦平臺的謠言信息傳播成為了謠言傳播的重要方式,構建推薦模式下的謠言傳播模型對網絡謠言的治理具有積極作用。考慮到推薦機制對用戶的分割效應,在謠言傳播過程中根據人物相似性將網絡用戶劃分在不同的傳播域,定義了傳播域中用戶與信息的交互方式,提出了一種基于謠言信息熱度和平臺用戶密度的謠言傳播模型,并對影響謠言信息傳播的因素進行了仿真分析。通過仿真發現:在推薦機制下,人們對信息的接受率主要是受信息本身影響;在推薦平臺上,增大謠言信息傳播閾值有利于阻止謠言的傳播;謠言的接受率越大,對辟謠信息的加入時間要求越高。
DoS attack method on Tor hidden service
楊歡樂,劉志天
doi: 10.20044/j.csdg.2097-1788.2022.01.010
Tor隱藏服務能保護服務提供方身份地址位置隱私。在分析Tor隱藏服務協議的基礎上,提出了針對隱藏服務進行DoS攻擊的策略。針對Tor隱藏服務發布、鏈路建立以及數據傳輸的不同階段對隱藏服務目錄、引入節點、隱藏服務守衛節點以及隱藏服務器等隱藏服務相關的網絡節點實施基于帶寬和內存的DoS攻擊,達到降低隱藏服務可用性的目的。通過仿真實驗進行了攻擊驗證,實驗結果表明,對守衛節點的DoS攻擊具有較好的攻擊效果,采用帶寬級別DoS攻擊,自定義構建20個長路徑能夠消耗守衛節點大約1.2 MB/s的帶寬資源,令普通用戶獲取隱藏服務的延遲時間中位數從9 s上升到30 s。采用內存級別的DoS攻擊策略,敵手每構建一個內存級別的停止讀攻擊連接消耗大約60 KB/s的帶寬資源就能以6 MB/s的速率消耗守衛節點內存。
A method of finding cyber security user based on network representation learning
劉向宇,燕 瑋,孟星妤,侯開茂
doi: 10.20044/j.csdg.2097-1788.2022.01.012
發現社交媒體中的網絡安全用戶對于追蹤網絡安全動態有重要意義,針對這一特定領域用戶的發現,提出了一種新的發現方法。首先利用社交媒體節點間的相互關注關系建立有向關系網絡,然后用網絡表示學習模型Node2vec生成節點的向量表示,并將收集到的網絡安全關鍵字轉化為特征向量,拼接后輸入分類算法進行預測。實驗結果表明,在社交媒體網絡安全數據集上,所提方法的預測準確率優于現有的其他特定領域用戶發現算法。
Design and implementation of multipath security connection anti-replay attack based on FPGA
陳 明,張宏亮,鄧 軍,唐 文,龔 萍
doi: 10.20044/j.csdg.2097-1788.2022.01.013
重放攻擊是一種常見的網絡攻擊手段,為了提高網絡設備的安全性,提出一種基于FPGA實現抗重放攻擊的設計方案。結合工程實踐,首先介紹了安全連接通信原理,并詳細討論了抗重放實現機制,在此基礎上創造性提出多路安全連接并發抗重放設計方案。測試結果表明,該技術能夠滿足多路安全連接通信的同時實現抗重放的應用需求,而且實現協議簡單,數據吞吐率高,對工程實現有一定的借鑒意義。
Research of data sharing information system architecture based on endogenous security
李 建1,2,王 昊1,2,姜藶峰1,2,羅清林1,2,吳凡毅1,2,3
doi: 10.20044/j.csdg.2097-1788.2022.01.011
在研究了我國數據共享信息化發展的階段規律和相應架構體系變遷的基礎上,結合我國數據治理法規標準體系要求和PKS自主計算體系發展現狀,研究在可信安全計算環境中數據不脫離數據擁有方的、可主動免疫的架構設計原則、實現方案,包括底層可信的基礎軟硬件系統,上層應用零信任的主動審計防御體系,以及“數據擁有方主導+數據交易第三方負責的可信網絡路由交換集中運維”的數據共享建設思路、建設內容、實施路徑等。最后指出未來數據共享應用場景中可能面臨的新風險、新問題,并提出構建符合法理要求和內生安全理念的新一代信息化架構體系的一些綜合建議。
智能算法
A global terrain height detection method based on elevation data
吳 瓊1,孫韶杰2,于 瀾1,蘇 迪1
doi: 10.20044/j.csdg.2097-1788.2022.01.014
在飛行模擬器訓練領域,很多分系統都需要實時獲取飛行位置的地形高度。基于衛星影像高程數據,提出了一個全球范圍的地形高度檢測方法。該方法將全球高程數據按度進行區域劃分和規范化命名,然后基于碰撞檢測的思想,從飛行當前位置垂直向下求取與地形面的交點,交點處的高程值即地形高度。針對不同采樣間距、不同分塊大小情況下的算法檢測效率進行了比較分析,實驗結果表明,該檢測方法能夠較好地滿足實時性和準確性要求。
A data augmentation method for online education sentiment analysis
黃偉強1,劉 海2,梁韜文2,楊海華2
doi: 10.20044/j.csdg.2097-1788.2022.01.015
在互聯網上大量主觀性的評論具有豐富的研究價值,可以通過對評論的分析獲取評論的情感極性。在對大量評論進行情感分析時,存在時間和人力消耗過多等問題,針對該問題,提出了基于聚類分析的文本數據擴充方法:在對少量關鍵數據進行標注的基礎上,通過聚類分析標注大量數據,以減少情感分析在實際應用中的成本。以在線教育平臺的評論為例,對目前多個主流在線教育平臺上爬取的共569 970條中文評論數據進行少量標注,然后使用該方法進行數據擴充,最后基于目前多個主流機器學習模型和卷積神經網絡模型進行情感分析訓練。研究結果表明,數據處理經過聚類后取得較好的數據擴充效果,其中采用卷積神經網絡模型進行的情感分析,準確度可以達到96.5%。
人工智能
Label embedding based multimodal multi-label emotion recognition
張 超,張信明
doi: 10.20044/j.csdg.2097-1788.2022.01.016
多模態情感分析目前是多模態分析和自然語言處理領域的研究熱點,在商品推薦、智能客服等場景中具有廣泛的應用。現有的方法在多標簽場景下對標簽間依賴性表示不充分,并且忽略了模態特征之間語義差距。對此提出了一種基于標簽嵌入的多模態多標簽情感識別算法,通過訓練的標簽嵌入向量捕獲標簽之間依賴關系,對模態特征添加約束減小模態之間的語義差距。實驗結果顯示,該算法在多模態多標簽情感識別任務中在準確率和漢明損失指標上相較于現有方法有明顯提升。
Multi-attention convolutional network for crowd counting
楊倩倩,何 晴,彭思凡,殷保群
doi: 10.20044/j.csdg.2097-1788.2022.01.017
針對實際場景中存在的人群非均勻分布問題,提出了一種基于多重注意力引導的人群計數算法。首先,基于輕量級金字塔切分注意力機制構建了自頂向下的特征融合路徑,旨在促進高層語義信息和低層空間細節的融合,生成高級語義和空間細節兼備的高質量特征圖;然后,提取并融合多尺度上下文信息,以此生成關注于不同密度分布模式的注意力權重圖;最后,通過注意力權重圖指導密度回歸網絡識別不同分布狀態下的行人目標,增強模型對密度變化的適應性,生成高質量人群密度圖。在ShanghaiTech、UCF_QNRF和JHU-CROWD++三個數據集上進行了大量的實驗來說明所提算法的先進性。