大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自數(shù)據(jù)派THU
作者:王佳鑫
編輯:于騰凱
校對:林亦霖
加密數(shù)字貨幣是數(shù)字貨幣的一種,,它不依靠法定貨幣機(jī)構(gòu)發(fā)行,不受央行管控,。借助于區(qū)塊鏈等新興技術(shù),加密數(shù)字貨幣主要表現(xiàn)出去中心化,、低交易費(fèi)用和成本,、國際流通、共識機(jī)制,、高度匿名性和分布式存儲等特征和優(yōu)勢,,而這會更易成為犯罪分子進(jìn)行違法活動的工具,,從而對全球的加密數(shù)字貨幣交易監(jiān)管提出了嚴(yán)峻的挑戰(zhàn)。加密數(shù)字貨幣監(jiān)管技術(shù)側(cè)重監(jiān)管和制止以加密數(shù)字貨幣方式的高科技犯罪活動,,是保護(hù)資金安全和國家安全的重要手段,,也是區(qū)塊鏈技術(shù)能夠得到廣泛應(yīng)用的前提條件[1]。
比特幣,、以太坊等現(xiàn)有的加密數(shù)字貨幣由于無法提供可行的監(jiān)管方法,,被廣泛應(yīng)用于網(wǎng)絡(luò)犯罪、洗錢,、勒索,、盜竊、詐騙和恐怖主義[2]等犯罪活動,,導(dǎo)致很多政府對整個加密數(shù)字貨幣技術(shù)持消極的態(tài)度,,甚至遏制了區(qū)塊鏈技術(shù)在其他應(yīng)用的發(fā)展。因此,,如何從海量的區(qū)塊鏈交易數(shù)據(jù)中提取有用的信息,,成為了當(dāng)前的研究熱點(diǎn),不僅有助于打擊基于加密數(shù)字貨幣的犯罪活動,,而且有助于為區(qū)塊鏈技術(shù)在其他領(lǐng)域的擴(kuò)展提供可行的監(jiān)管方案[3],。
由于區(qū)塊鏈技術(shù)的去中心化和不可篡改特點(diǎn),,加密數(shù)字貨幣的所有交易記錄都是不可逆的,,其交易記錄和所有權(quán)記錄都以圖形結(jié)構(gòu)的方式被安全地存儲和驗(yàn)證在區(qū)塊中。這些交易記錄包含了豐富和完整的信息,,其中每一個區(qū)塊鏈地址可以被視為一個節(jié)點(diǎn),,而每一次的交易則可以被視為一個邊。因此,,區(qū)塊鏈交易數(shù)據(jù)實(shí)質(zhì)上是一種圖結(jié)構(gòu)數(shù)據(jù),,通過將加密貨幣系統(tǒng)中的對象(如地址、交易,、智能合約等)概念化為節(jié)點(diǎn),,并將它們的交互建模為連接,圖建??捎糜趶牟煌嵌葮?gòu)建交互活動的表示,。這樣可以自動分析圖特征,揭示異常交易圖結(jié)構(gòu),,方便識別異常交易行為的節(jié)點(diǎn),。圖深度學(xué)習(xí)為加密貨幣交易中的大規(guī)模異構(gòu)數(shù)據(jù)建模提供了一個視角。
圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Network, GNN)是一種專門用于處理圖形數(shù)據(jù)的深度學(xué)習(xí)算法,,具有強(qiáng)大的圖表示學(xué)習(xí)能力,。它可以直接在圖上進(jìn)行學(xué)習(xí)和預(yù)測,,從而有效地捕捉圖中節(jié)點(diǎn)之間的復(fù)雜關(guān)系。圖神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域已經(jīng)展示出了其強(qiáng)大的性能,,例如社交網(wǎng)絡(luò)分析,、生物信息學(xué)、物聯(lián)網(wǎng),、推薦系統(tǒng)等。圖神經(jīng)網(wǎng)絡(luò)以其獨(dú)特的優(yōu)勢,,為區(qū)塊鏈交易數(shù)據(jù)分析提供了新的視角和工具,。通過圖神經(jīng)網(wǎng)絡(luò),我們可以更好地理解和分析區(qū)塊鏈交易數(shù)據(jù)中的復(fù)雜模式,,例如交易追溯,、賬戶分類、異常檢測等。
1.?dāng)?shù)據(jù)來源與獲取
區(qū)塊鏈交易數(shù)據(jù)面向公眾,,在這一部分我們闡述如何收集區(qū)塊鏈相關(guān)數(shù)據(jù),,包括地址交易記錄和加密數(shù)字貨幣生態(tài)標(biāo)簽數(shù)據(jù)。
1.1地址和交易數(shù)據(jù)
通過安裝一個客戶端(如比特幣的BitcoinCore和以太坊的Geth)訪問網(wǎng)絡(luò)和同步塊數(shù)據(jù),,我們可以從區(qū)塊鏈獲取原始數(shù)據(jù),。然而,對于許多加密數(shù)字貨幣來說,,它們的原始區(qū)塊鏈數(shù)據(jù)是以二進(jìn)制格式存儲的,,需要解析為可讀的格式以便進(jìn)一步分析。因此,,我們可以利用解析工具(如比特幣的Bitcoin-ETL和以太坊的Ethereum-ETL)獲得的原始數(shù)據(jù)中提取交易記錄,。
1、https://bitcoin.org/en/bitcoin-core/
2,、https://geth.ethereum.org/
3,、https://github.com/blockchain-etl/bitcoin-etl
4、https://github.com/blockchain-etl/ethereum-etl
1.2標(biāo)簽數(shù)據(jù)
標(biāo)簽信息對于一些特殊的交易網(wǎng)絡(luò)挖掘訓(xùn)練任務(wù)如異常檢測和交易模式分析是非常必要的,。然而,,區(qū)塊鏈系統(tǒng)的用戶以匿名方式進(jìn)行交易,這使得獲取身份或標(biāo)簽信息變得困難,。這里我們總結(jié)了一些為加密貨幣生態(tài)系統(tǒng)提供標(biāo)簽信息的著名網(wǎng)站,,其詳細(xì)信息如下表所示。
2.圖建模
數(shù)據(jù)采集完成后,,在進(jìn)行交易網(wǎng)絡(luò)分析之前,,我們需要做的第一步是將交易數(shù)據(jù)表示成網(wǎng)絡(luò)結(jié)構(gòu)的數(shù)據(jù)形式,即網(wǎng)絡(luò)建模,。
對于采用以交易為中心模型的的區(qū)塊鏈系統(tǒng)(如比特幣,,見圖1),,由于交易的輸入是來自以前的交易,,因此交易網(wǎng)絡(luò)(Transaction-Transaction Graph)的構(gòu)建是最直接的,其中交易作為節(jié)點(diǎn),,有向邊(包括金額和時間戳信息)表示資金流動,。考慮到一個用戶可能擁有多個匿名地址,,因此部分研究將地址聚類為實(shí)體(即實(shí)體識別,,將擁有相同所有權(quán)的地址聚類在一起),構(gòu)建以用戶為節(jié)點(diǎn),、用戶之間的資金流動為邊的用戶網(wǎng)絡(luò)(User-User Graph),。然而在區(qū)塊鏈系統(tǒng)中,地址的真實(shí)所有權(quán)是未知的,,因此不可能獲得準(zhǔn)確的用戶網(wǎng)絡(luò),。比特幣的另一種網(wǎng)絡(luò)模型是地址網(wǎng)絡(luò)(Address-Address Graph),,其中每個節(jié)點(diǎn)代表一個地址,如果一對地址之間至少有一個交易,,則一對地址之間存在一條邊,。最后一種網(wǎng)絡(luò)模型是加權(quán)有向超圖(Address-Transaction HyperGraph),節(jié)點(diǎn)是兩個交易和地址的類型,,可以表示地址與交易之間的輸入輸出關(guān)系,。
圖1 比特幣交易模型
對于采用以賬戶為中心模型的區(qū)塊鏈系統(tǒng)(如以太坊、波場等,,見圖2),,每筆交易只有一個輸入地址和一個輸出地址,輸入或輸出關(guān)系是明確的,,因此外部賬戶(EOAs)和合約帳戶(CAs)都可以節(jié)點(diǎn)的形式表示,,但邊的語義不同,邊可以表示資金流動的方向,,也可以表示合約的創(chuàng)建和調(diào)用關(guān)系,。目前網(wǎng)絡(luò)建模的一個重要問題是如何使所構(gòu)建的網(wǎng)絡(luò)更好地保留交易信息,因此也可以將以太坊交易記錄建模為一個時間加權(quán)的多有向圖,。
圖2 以太坊交易模型
3.圖任務(wù)
現(xiàn)有基于圖神經(jīng)網(wǎng)絡(luò)的區(qū)塊鏈交易數(shù)據(jù)分析研究主要分為異常檢測,、賬戶分類、交易追溯三大下游任務(wù),。其中異常檢測指的是二分類的加密地址欺詐身份識別,,即檢測區(qū)塊鏈生態(tài)系統(tǒng)中的異常行為,如龐氏騙局,、欺詐和網(wǎng)絡(luò)釣魚騙局等),,賬戶分類指的是多分類的加密地址身份識別,交易追溯指的是對目標(biāo)地址和交易進(jìn)行追蹤,、溯源和監(jiān)控,。下表展示了這三個任務(wù)的論文列表。
表1基于圖神經(jīng)網(wǎng)絡(luò)的區(qū)塊鏈交易數(shù)據(jù)分析研究
結(jié)論
區(qū)塊鏈本質(zhì)上是一個分布式的數(shù)據(jù)庫技術(shù),,具有去中心化,、不可篡改、全程留痕,、匿名性等特點(diǎn),。區(qū)塊鏈技術(shù)帶來的重大變革,,也對金融服務(wù),、生態(tài)安全、隱私保護(hù)提出了諸多挑戰(zhàn),。GNN天然適合于區(qū)塊鏈數(shù)據(jù)的分析,從結(jié)構(gòu)上看,,區(qū)塊鏈數(shù)據(jù)本質(zhì)上由一個圖表示,,其中節(jié)點(diǎn)表示地址,邊表示交易等行為,,構(gòu)建交易圖后模型可以提取圖結(jié)構(gòu)關(guān)系中高維度的特征,,這些特征在做下游學(xué)習(xí)任務(wù)時往往表現(xiàn)很好。
參考文獻(xiàn):
[1] 王佳鑫,顏嘉麒,毛謙昂.加密數(shù)字貨幣監(jiān)管技術(shù)研究綜述[J/OL].計(jì)算機(jī)應(yīng)用:1-14[2023-07-26].
[2] 顏嘉麒,王佳鑫,毛謙昂等.加密數(shù)字貨幣恐怖融資監(jiān)管:交易模式分析與異常實(shí)體識別[J].圖書情報知識,2022,39(06):55-66.
[3] Wang, J., Yan, J., Mao, Q., (2022). Detecting and Characterizing Abnormal Addresses in the Bitcoin Transaction System: A Social Network Approach, 15th China Summer Workshop on Information Management(CSWIM 2022), Ningbo, China, 145-150.
[4] Zhang R, Zhang G, Liu L, et al. Anomaly detection in bitcoin information networks with multi-constrained meta path[J]. Journal of Systems Architecture, 2020, 110: 101829.
[5] Lo W W, Kulatilleke G K, Sarhan M, et al. Inspection-L: self-supervised GNN node embeddings for money laundering detection in bitcoin[J]. Applied Intelligence, 2023: 1-12.
[6] Wang L, Xu M, Cheng H. Phishing scams detection via temporal graph attention network in Ethereum[J]. Information Processing & Management, 2023, 60(4): 103412.
[7] Wen H, Fang J, Wu J, et al. Hide and Seek: An Adversarial Hiding Approach Against Phishing Detection on Ethereum[J]. IEEE Transactions on Computational Social Systems, 2022.
[8] Jin H, Li C, Xiao J, et al. Detecting arbitrage on ethereum through feature fusion and positive-unlabeled learning[J]. IEEE Journal on Selected Areas in Communications, 2022, 40(12): 3660-3671.
[9] Jin C, Jin J, Zhou J, et al. Heterogeneous feature augmentation for ponzi detection in ethereum[J]. IEEE Transactions on Circuits and Systems II: Express Briefs, 2022, 69(9): 3919-3923.
[10] Yu T, Chen X, Xu Z, et al. MP-GCN: A Phishing Nodes Detection Approach via Graph Convolution Network for Ethereum[J]. Applied Sciences, 2022, 12(14): 7294.
[11] Wang, J., Mao, Q., Yan, J.,et al (2023). Identifying Crypto Addresses with Gambling Behaviors: A Graph Neural Network Approach, Pacific Asia Conference on Information Systems(PACIS 2023), Nanchang, China.
[12] Shao W, Li H, Chen M, et al. Identifying bitcoin users using deep neural network[C]//Algorithms and Architectures for Parallel Processing: 18th International Conference, ICA3PP 2018, Guangzhou, China, November 15-17, 2018, Proceedings, Part IV 18. Springer International Publishing, 2018: 178-192.
[13] Huang Z, Huang Y, Qian P, et al. Demystifying Bitcoin Address Behavior via Graph Neural Networks[J]. arXiv preprint arXiv:2211.14582, 2022.
[14] Zhou J, Hu C, Chi J, et al. Behavior-aware account de-anonymization on ethereum interaction graph[J]. IEEE Transactions on Information Forensics and Security, 2022, 17: 3433-3448.
[15] Liu J, Zheng J, Wu J, et al. FA-GNN: Filter and augment graph neural networks for account classification in ethereum[J]. IEEE Transactions on Network Science and Engineering, 2022, 9(4): 2579-2588.
[16] Huang T, Lin D, Wu J. Ethereum account classification based on graph convolutional network[J]. IEEE Transactions on Circuits and Systems II: Express Briefs, 2022, 69(5): 2528-2532.
[17] Li Z, He E. Graph Neural Network-Based Bitcoin Transaction Tracking Model[J]. IEEE Access, 2023.
[18] Lin D, Wu J, Xuan Q, et al. Ethereum transaction tracking: Inferring evolution of transaction networks via link prediction[J]. Physica A: Statistical Mechanics and its Applications, 2022, 600: 127504.
[19] Xie Y, Jin J, Zhang J, et al. Temporal-amount snapshot multigraph for ethereum transaction tracking[C]//Blockchain and Trustworthy Systems: Third International Conference, BlockSys 2021, Guangzhou, China, August 5–6, 2021, Revised Selected Papers 3. Springer Singapore, 2021: 133-146.
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1064038.html
溫馨提示:投資有風(fēng)險,,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。