在中辦、國辦印發(fā)的《關(guān)于進一步深化稅收征管改革的意見》中,“大數(shù)據(jù)”一詞被提及了13次。兩辦《意見》不僅將大數(shù)據(jù)定義為建設智慧稅務的“驅(qū)動力”,還對大數(shù)據(jù)理念的理解和管理服務的應用提出了新要求。
在大企業(yè)稅收管理和服務方面,大數(shù)據(jù)應用已然成為“必選項”。豐富的數(shù)據(jù)來源,是稅務部門應用大數(shù)據(jù)的基石。
為了很好地落實兩辦《意見》,稅務部門可從深挖外部數(shù)據(jù)、用好非結(jié)構(gòu)化數(shù)據(jù)入手,進一步拓展數(shù)據(jù)來源,及時發(fā)現(xiàn)隱藏的信息——有效涉稅數(shù)據(jù)體量越大,建設智慧稅務的“驅(qū)動力”就越大。
內(nèi)部數(shù)據(jù)與外部數(shù)據(jù)相互驗證、相互結(jié)合,是提升稅收數(shù)據(jù)有效性和延展性的重要方法之一。
就內(nèi)部數(shù)據(jù)來看,通過多年的信息化建設,稅務部門在數(shù)據(jù)采集、應用方面積累了豐富的經(jīng)驗,打下了堅實的基礎。
稅務部門內(nèi)部數(shù)據(jù)的效用已經(jīng)得到多方認可。
抗擊新冠肺炎疫情期間,包括發(fā)票數(shù)據(jù)在內(nèi)的各類稅收數(shù)據(jù),為國家政策制定提供了有力的數(shù)據(jù)支撐,就是很好的例證。
相比較而言,在外部數(shù)據(jù)上,稅務部門還需做更深層的挖掘。
外部數(shù)據(jù)是稅收數(shù)據(jù)分析不可或缺的組成部分。
深挖外部數(shù)據(jù),有助于提升稅收數(shù)據(jù)價值量、關(guān)聯(lián)度和延展性。
比如,工商開業(yè)、注銷數(shù)據(jù)和稅務登記注銷數(shù)據(jù)的組合,不但促成了五證合一,而且提高了納稅人辦稅便利度;稅務人員在開展出口退稅申報、審核和后續(xù)分析工作時,需要以海關(guān)報關(guān)數(shù)據(jù)為依據(jù)。
在對大企業(yè)開展日常風險分析、疑點核實時,外部數(shù)據(jù)同樣可以發(fā)揮重要作用。
舉例來說,利用對外支付信息,不僅能夠分析企業(yè)是否存在逃避繳納涉外稅款的問題,而且可以用來識別企業(yè)惡意拆分合同付款金額的行為;利用專利相關(guān)的信息,既能幫助稅務部門篩選高新技術(shù)企業(yè)稅收優(yōu)惠的推送目標,又能幫助稅務部門篩查“假高新”;公安系統(tǒng)的身份信息,還能成為查處涉稅違法違規(guī)案件的有力武器。
隨著數(shù)據(jù)共享和數(shù)據(jù)關(guān)聯(lián)的不斷深入,大企業(yè)稅收服務和管理部門可以深挖外部數(shù)據(jù),將內(nèi)部數(shù)據(jù)與外部數(shù)據(jù)有機結(jié)合,夯實數(shù)據(jù)分析成果。
隨著信息技術(shù)的飛速發(fā)展,帶寬增加、存儲容量提升,推動了數(shù)據(jù)結(jié)構(gòu)的多樣化發(fā)展。海量的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),給稅收數(shù)據(jù)分析工作帶來了機遇,也提出了挑戰(zhàn)。
在現(xiàn)有稅收數(shù)據(jù)分析中,對于結(jié)構(gòu)化數(shù)據(jù)的應用比較成熟。未來,有必要進一步探索和應用非結(jié)構(gòu)化數(shù)據(jù)。
結(jié)構(gòu)化數(shù)據(jù),就是存儲在數(shù)據(jù)庫里,可以用二維表結(jié)構(gòu)實現(xiàn)邏輯表達的數(shù)據(jù)。
以大企業(yè)稅收服務和管理場景為例,稅務部門對征管、發(fā)票等數(shù)據(jù)進行清洗、分類和加工,搭建起的大企業(yè)數(shù)據(jù)倉庫;從集團企業(yè)所屬行業(yè)、供銷關(guān)系、財務管理等多個維度建立起來的數(shù)據(jù)池和數(shù)據(jù)集市,都是對結(jié)構(gòu)化數(shù)據(jù)的應用。
非結(jié)構(gòu)化數(shù)據(jù),指不方便用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù)。
所有格式的辦公文檔、文本、圖片以及標準通用標記語言下的子集XML、HTML、各類報表、圖像和音頻(視頻)信息等,都屬于非結(jié)構(gòu)化數(shù)據(jù)。用好這類數(shù)據(jù),有助于稅務部門建立更為立體的大企業(yè)數(shù)據(jù)分析架構(gòu)。
具體來說,通過采集上市公司審計報告、各類鑒證報告等數(shù)據(jù)資料,可以對照對應企業(yè)財務報告數(shù)據(jù)的準確性和完整性,驗證企業(yè)各類報告的可信性,發(fā)現(xiàn)企業(yè)申報材料隱藏的經(jīng)營行為;通過互聯(lián)網(wǎng)定向抓取大企業(yè)招聘、中標等信息,可以為日常管理提供輔助信息;銀行轉(zhuǎn)賬信息、移動通信數(shù)據(jù)等,可以作為稽查取證的“殺手锏”。
基于此,稅務部門在深耕結(jié)構(gòu)化數(shù)據(jù)的同時,也應用好非結(jié)構(gòu)化數(shù)據(jù),實現(xiàn)對大企業(yè)的多層次分析。
(作者單位:國家稅務總局大連市稅務局)