亚洲v欧美日韩一区|中国不卡视频免费一区二区|小黄片观看视频欧美|在线观看加勒比网站|丁香精品久久亚洲日本片|成人免费AV大片|美女婷婷综合骚妇无码|亚洲女人的大黑逼视频一区二区三区|成人操人在线播放|久久久一二三区

返回列表 發(fā)布新帖

[李為人] 【2021年05月21日】運用遺傳算法優(yōu)化稅收風險分析指標模型的思考

1712 0 樓主
發(fā)表于 2021-11-4 17:11:24 | 只看樓主 閱讀模式
|
精選公眾號文章
公眾號名稱: 稅務(wù)研究
標題: 運用遺傳算法優(yōu)化稅收風險分析指標模型的思考
作者: 李為人
發(fā)布時間: 2021-05-21
原文鏈接: http://mp.weixin.qq.com/s?__biz=MzU5MTgxNTQ5OQ==&mid=2247494149&idx=1&sn=6993b60ec1b908d7d0f1ef7caf64ceeb&chksm=fe2b9c21c95c1537237dd07b5e9b22d4c877cecd539d7624f2374182a8ff8162e03e989c9bf9#rd
備注: -
公眾號二維碼: -
運用遺傳算法優(yōu)化稅收風險分析指標模型的思考
李為人(中國社會科學(xué)院大學(xué)商學(xué)院)王一杰(北京市海淀區(qū)人民政府辦公室)

指標模型是稅收風險分析的重要工具。如何建立科學(xué)、動態(tài)、高效的指標模型,一直是稅收風險管理部門面臨的重要課題之一。建立指標模型的傳統(tǒng)方法依賴于專家經(jīng)驗的積累和稅收實踐的修正,缺陷在于過程漫長、內(nèi)容局限、成本較高。當前,隨著人工智能技術(shù)的快速發(fā)展,我們可以引入人工智能領(lǐng)域的遺傳算法優(yōu)化稅收風險分析。運用遺傳算法可以快速掃描稅收元數(shù)據(jù),遴選出有效指標,并將其隨機交叉組合,然后通過不斷變異和迭代,形成日臻完善的稅收風險指標模型,從而快速、高效提升稅收風險管理的質(zhì)量和效率。

一、指標模型是稅收風險分析的核心
風險分析作為稅收風險管理的核心環(huán)節(jié)之一,是指通過一定的方式方法,了解納稅人遵從稅法的不確定性程度。在稅收風險分析過程中,指標和模型起著至關(guān)重要的作用。指標是指預(yù)期達到的指數(shù)和標準。例如,通過“增值稅行業(yè)平均稅負率”這個指標,我們可以評判某一行業(yè)的增值稅平均稅負水平,并在此基礎(chǔ)上確定某一納稅人的增值稅稅負的偏離程度,進而評判該納稅人風險程度的高低。模型是指由多個有共同指向性的指標、指標值和算法構(gòu)成的集合。例如,我們可以用行業(yè)、企業(yè)從業(yè)人員、營業(yè)收入、資產(chǎn)總額等四個指標,評判一個企業(yè)是否符合小型微利企業(yè)的條件,判斷條件的計算機語言為“行業(yè)=非限制和禁止行業(yè)、年度應(yīng)納稅所得額≤300萬元、從業(yè)人員≤300人、資產(chǎn)總額≤5 000萬元”,這一判斷條件就是一個簡單的模型。


為了得到更好的分析效果,我們需要建立多個指標和模型,并將其存儲為指標模型庫。但稅收政策、納稅人行為等因素都是在不斷變化的,這決定了指標模型具有動態(tài)性和復(fù)雜性,指標模型的建設(shè)也是一個不斷優(yōu)化、持續(xù)迭代的過程。一般而言,指標模型的建設(shè)過程首先是找來若干稅收專家,整合專家個人的工作經(jīng)驗,提出一批經(jīng)稅收實踐檢驗過的指標,構(gòu)成初始的指標模型1.0版;然后將指標模型應(yīng)用于稅收風險管理實踐,根據(jù)反饋的情況不斷進行補充、完善,構(gòu)成指標模型2.0版、3.0版,以此類推。


以上這種通過吸收相關(guān)專家經(jīng)驗成果,形成并不斷優(yōu)化指標模型,然后將其應(yīng)用于稅收風險分析的傳統(tǒng)做法,具有一定的優(yōu)勢,但其劣勢也顯而易見。

一是更新過程慢。當前,我國經(jīng)濟轉(zhuǎn)型升級步伐不斷加快,新產(chǎn)業(yè)、新業(yè)態(tài)、新模式不斷涌現(xiàn),管理方式和運營模式也發(fā)生了深刻變革。這在稅收風險領(lǐng)域表現(xiàn)為納稅人應(yīng)對方式已發(fā)生改變,而風險分析的相關(guān)指標模型還是原來的套路,即使納稅人出現(xiàn)了一定的稅收風險,傳統(tǒng)的指標模型也無法及時發(fā)現(xiàn),甚至完全失效。


二是思路范圍窄。只能對部分專家已經(jīng)了解過的知識點進行歸納總結(jié),而數(shù)字經(jīng)濟快速發(fā)展所產(chǎn)生的應(yīng)用平臺如工業(yè)互聯(lián)網(wǎng)、智慧農(nóng)業(yè)平臺往往會產(chǎn)生龐雜的數(shù)據(jù),專家的知識儲備及人工分析無法全面涉及。除此之外,由互聯(lián)網(wǎng)推動的一二三產(chǎn)業(yè)的融合發(fā)展,也會使得傳統(tǒng)的指標模型生成方法缺乏發(fā)現(xiàn)更大范圍相關(guān)數(shù)據(jù)的能力。


三是工作成本高。新的政策出臺,新產(chǎn)業(yè)、新業(yè)態(tài)、新模式的快速產(chǎn)生與發(fā)展往往需要再集中專家力量制發(fā)新的指標模型,這會產(chǎn)生較高的組織和經(jīng)濟成本。基于此,我們需要探索更為快速、有效的指標模型生成方法。

二、遺傳算法與稅收風險分析指標模型的有機結(jié)合
作為稅收風險分析的重要工具,指標模型的有效性直接決定了重大稅收風險的防范和化解水平,而指標模型是否處于持續(xù)優(yōu)化狀態(tài)直接決定了稅收風險分析系統(tǒng)是否處于穩(wěn)定運行狀態(tài)。當前,經(jīng)濟社會的發(fā)展對稅收風險分析系統(tǒng)的沖擊使得傳統(tǒng)的指標模型在應(yīng)對風險變化上心有余而力不足,如何化危為機,關(guān)鍵在于能否構(gòu)建可以快速更迭、與時俱進的指標模型,而大數(shù)據(jù)和人工智能算法的不斷發(fā)展給我們帶來了重要轉(zhuǎn)機。


(一)遺傳算法的基本原理
  人工智能算法隨著技術(shù)的發(fā)展變得復(fù)雜且多樣,其基礎(chǔ)算法中的遺傳算法更加適合當前稅收風險指標模型動態(tài)優(yōu)化系統(tǒng)的構(gòu)建。所謂遺傳算法(Genetic Algorithm,GA),是指模擬達爾文生物進化論的自然選擇和遺傳學(xué)機理的生物進化過程的計算模型,是一種通過模擬自然進化過程搜索最優(yōu)解的方法。遺傳算法其本質(zhì)所展現(xiàn)的就是優(yōu)勝劣汰效應(yīng),不斷篩選出最優(yōu)秀的個體,在整個“進化”過程中,“最優(yōu)”不是恒定不變的,而是不斷發(fā)展和更新的。遺傳算法的內(nèi)在運行機制能夠使得指標模型不斷進行自我迭代,通過內(nèi)設(shè)的適應(yīng)度函數(shù)對指標優(yōu)勝劣汰,把適合目標要求的指標保留下來,把無效或者次要的指標排除掉。


與傳統(tǒng)算法不同,遺傳算法不以單個初始值進行迭代求取最優(yōu)解,而是以群體中所有個體為對象,利用概率(Pm)的變遷規(guī)則以及隨機化技術(shù)對編碼的參數(shù)空間進行隨機搜索,以有效避免傳統(tǒng)算法易于陷入局部最優(yōu)解的困境,同時也易于實現(xiàn)并行化從而大幅提高全局搜索能力。遺傳算法可以通過適應(yīng)度函數(shù)直接對結(jié)構(gòu)對象進行操作,基本不需要搜尋空間知識以及輔助信息,且適應(yīng)度函數(shù)不存在求導(dǎo)和函數(shù)連續(xù)性的限定,其定義域也可以任意設(shè)定,這就使得遺傳算法的應(yīng)用范圍得到了極大的拓展。參數(shù)編碼、初始群體的設(shè)定、適應(yīng)度函數(shù)的設(shè)計、遺傳操作設(shè)計、控制參數(shù)設(shè)定共同構(gòu)成遺傳算法的整體架構(gòu),而遺傳操作主要包括選擇、交叉及變異三種算法(見圖1,略)。


(二)遺傳算法與稅收風險分析指標模型的結(jié)合
  通過對遺傳算法基本原理和傳統(tǒng)意義上的指標模型建設(shè)過程的簡要介紹,我們可以發(fā)現(xiàn),二者具有天然的相似性。一是具有共同的工作機理。遺傳算法的原理是通過組合不同的基因構(gòu)成染色體,形成不同的個體,個體在實際環(huán)境中得到檢驗,適應(yīng)的被留下,不適應(yīng)的被淘汰,如此循環(huán)往復(fù)、不斷優(yōu)化。指標模型也是通過組合不同的元數(shù)據(jù),如銷售收入、應(yīng)繳增值稅等信息系統(tǒng)中最基礎(chǔ)的數(shù)據(jù)單位,形成指標模型,指標模型在稅收實踐中被檢驗,有用的被留下,沒用的被淘汰,最終形成日漸精準的指標模型庫。二是具有共同的復(fù)雜性。遺傳算法的基因數(shù)據(jù)量龐大,凡是與目標相關(guān)的因素全部納入計算范圍。稅收風險分析的指標模型建設(shè)與之相類似,也要考慮全部稅收及財務(wù)指標。三是具有共同的突變處理機制。遺傳算法中有選擇、交叉和變異三種基本算法,其中,變異是指因內(nèi)部或外部原因造成的染色體的變化。風險指標模型建設(shè)中也有類似過程,如稅收政策的改變帶來部分指標模型的變化,某個典型的稅收分析案例發(fā)現(xiàn)了新的指標,等等。


在遺傳算法運行初期,人工智能系統(tǒng)就像“剛出生的嬰兒”,需要不斷被“喂食”,而這食物就是我們所說的元數(shù)據(jù)。得到了“食物”之后,人工智能系統(tǒng)才有可能開始自己學(xué)習,慢慢成長為一個有智慧的“人”。在遺傳算法中,人工智能逐漸變得“聰明”的過程稱之為迭代。如在稅收風險分析中,初期人工智能系統(tǒng)將稅收元數(shù)據(jù)隨機匹配成指標,再選取隨機數(shù)量的指標形成一個指標集,即一條染色體,接著我們通過迭代的方式使之“進化”產(chǎn)生新的染色體,這個產(chǎn)生新染色體的過程我們稱之為基因重組。


遺傳算法在運行初期所產(chǎn)生的初代指標集,是計算機根據(jù)概率隨機組成的,因此,并不具有代表意義,要想使指標模型優(yōu)化進而達到能夠有效分析稅收風險的目的,就要不斷產(chǎn)生新的指標集。在以往稅收風險分析指標的構(gòu)建中,這個程序往往是通過人工篩選提煉的方式進行,過程漫長且具有不確定性,滯后于實際變化。而通過基因重組程序,可以將父代指標集進行切割、重組,從而自我形成新的指標集,雖然這個過程仍然存在隨機性,但通過適應(yīng)度函數(shù)和計算機的強大運行能力,在多次迭代后產(chǎn)生的后代指標集會逐步優(yōu)化。稅收風險分析指標模型的遺傳算法主要操作包括選擇、交叉和變異,以下分別說明。
1.選擇。選擇是指從群體中選擇優(yōu)良的個體并淘汰劣質(zhì)個體的操作。這一操作是建立在適應(yīng)度評估的基礎(chǔ)上的。一般而言,適應(yīng)度越大的個體,被選擇的可能性就越大,其后代就越多,但并非適應(yīng)度越高的后代肯定就越多,只能從概率上而言更多。那么,我們?nèi)绾谓⑦@種概率關(guān)系來選取父染色體和母染色體呢?目前常用的選擇方法有輪盤賭算法、最佳個體保留法、期望值法、排序選擇法、競爭法、線性標準化法等。本文以常用的選擇方法——輪盤賭算法(Roulette WheelSelection)為例進行說明。

輪盤賭算法的基本思想是個體被選中的概率與其適應(yīng)度函數(shù)值成正比。


假設(shè)群體大小為n,個體i的適應(yīng)度為Fi,則個體i被選中遺傳到下一代群體的概率為:p= Fi÷ΣFi。
每次進化后我們都要通過適應(yīng)度函數(shù)計算新染色體的適應(yīng)度。設(shè)想群體全部個體的適應(yīng)度分數(shù)用一張餅圖來表示(如圖2所示,略)。

餅圖中每一個小塊即代表群體中每一條染色體,塊的大小與染色體的適應(yīng)度成正比,適應(yīng)度越高,它在餅圖中對應(yīng)的小塊所占面積也越大。為了選取一條染色體,要做的就是旋轉(zhuǎn)這個輪子,直到輪盤停止時,看指針停止在哪一塊上,就選中與之對應(yīng)的那條染色體。因此,適應(yīng)度越高的染色體便越有可能被選為父(母)染色體,這也就是為什么遺傳算法能保留優(yōu)良基因的原因。


在運用遺傳算法構(gòu)建稅收風險分析指標模型過程中,如何通過算法來保留有效指標不被淘汰是關(guān)鍵問題之一。在計算機世界中,對一個問題的評價往往是通過概率的形式進行的,優(yōu)與良對應(yīng)著概率的高與低。通過適應(yīng)度函數(shù)我們可以評價迭代產(chǎn)生的指標集,并為其打分,單個指標集所獲得的分數(shù)就是決定其迭代過程中被選取概率的分子,而分母則是所有指標集所獲得的分數(shù)的總和。通過這個概率我們可以決定被評價的指標集在下一輪迭代中“存活”的機會。但概率終究會出現(xiàn)偏差,即使某個指標集存活的概率達到99%,依然有1%的概率在下一輪迭代中不被選到。為了解決這個問題,我們運用微生物遺傳算法的概念,將評分較高的指標集直接復(fù)制給下一代,這樣就可以保證有效指標的存活,從而提高后代指標集的有效性。


2.交叉。交叉操作是遺傳算法獲取優(yōu)良個體的重要手段,可以大大提高遺傳算法的搜索能力。運行過程中我們選取兩條父代染色體,可以理解為父染色體和母染色體,接著將兩個父代個體的部分結(jié)構(gòu)加以替換重組,形成一條子染色體,這條子染色體既包含父染色體的一部分也包含母染色體的一部分,這就是新染色體形成的過程。交叉操作按照事先設(shè)定好的概率(交叉概率一般取較大值,通常為0.6~0.9)在風險指標庫中隨機選取兩條染色體并且在隨機位置進行交叉重組。舉例而言,在遺傳算法運行初期,計算機會隨機創(chuàng)建初始化種群,種群由大量隨機產(chǎn)生的染色體組成,計算機隨機選取兩個具有各自特征的指標集(兩條染色體)。(1)父染色體:毛利率、稅收負擔率、存貨收入比……銷售成本率、工資費用。(2)母染色體:原材料成本率、銷售利潤率、存貨周轉(zhuǎn)率……財務(wù)費用收入比、流動比率。遺傳算法程序?qū)⒏复旧w在第三個指標處切斷,將母代染色體在倒數(shù)第五個指標處切斷,在兩者切斷處重組,就可以形成一條新的子染色體:毛利率、稅收負擔率、存貨收入比、財務(wù)費用收入比、流動比率(詳見圖3,略)。

盡管輪盤賭算法可以保證優(yōu)良基因的代代相傳,但并不能保證通過交叉重組形成的子染色體的適應(yīng)度高于父母染色體,為了解決這個問題,我們引入微生物遺傳算法(Microbial GA)這個概念,主要解決遺傳算法中無法有效保留“好父母”的問題,即無論“父母”多么優(yōu)秀,都不會被保留,只能將各自基因的一部分進行基因重組,但基因重組后的子代染色體并不一定優(yōu)于“父母”。此過程是通過迭代將染色體中表現(xiàn)好的基因不作任何改變放入子代染色體中,這樣可以避免交叉重組之后染色體適應(yīng)度低于“父母”染色體所產(chǎn)生的不良后果,最大限度地保證染色體的質(zhì)量。


實際上,這個過程在計算機的運行中并不需要很長時間,且計算機可以全天候運行,效率遠遠高于人力手段,可充分保證交叉程序的時效性和有效性。不僅如此,自我產(chǎn)生數(shù)據(jù)且自我分析學(xué)習數(shù)據(jù)也是人工智能超越以往計算機技術(shù)的一個重要方面,遺傳算法的交叉程序可以通過父代指標集自動生成新一代子指標集,這就是人工智能自我產(chǎn)生數(shù)據(jù)的過程。與此同時,遺傳算法的交叉程序還可以通過適應(yīng)度函數(shù)不斷評價產(chǎn)生的指標集的有效性,這是人工智能自我學(xué)習分析數(shù)據(jù)的過程??梢哉f,遺傳算法是人工智能領(lǐng)域一個有效的智能算法,在稅收風險指標模型構(gòu)建中發(fā)揮著重要作用。


3.變異。在遺傳算法中,變異是很重要的一步,原因是選擇和交叉只能保證原有優(yōu)良基因的保留。通過輪盤賭算法將原有的指標集中有用的指標傳承下去,染色體中的基因并沒有改變,只是通過改變排列組合的方式讓指標集變得更加符合實際問題的解決。但這就存在一個問題,通過交叉機制只能保證經(jīng)過n 次進化后,計算結(jié)果更接近于局部最優(yōu)解,而永遠沒辦法達到全局最優(yōu)解,并且會造成某些有效信息指標的永久缺失。人工智能系統(tǒng)要想完全獨立分析必須通過自己的機制找到全局最優(yōu)解。如果僅是原有指標集的優(yōu)化升級,只能解決大部分一般性的情況,而小部分具有特殊性的問題需要特殊的指標集進行處理,而此時引入基因變異則是最好的解決辦法。
遺傳算法中的變異過程與自然界的基因突變類似,即以很小的變異概率隨機地改變?nèi)旧w中某些基因的值。變異操作的基本過程是:產(chǎn)生一個[0,1] 之間的隨機數(shù)(rand),若rand<Pm,則進行變異操作,隨機選擇子染色體上的部分基因,用基因庫中的其他基因?qū)⑵浯?,從而給現(xiàn)有的染色體引入新的基因。在變異操作中,選擇的變異概率盡可能低,通常取0.000 1~0.1,否則遺傳算法就退化成了隨機搜索。以前文例子進一步舉例而言。


提取基因重組過程產(chǎn)生的子染色體:毛利率、稅收負擔率、存貨收入比、財務(wù)費用收入比、流動比率。子染色體中包含許多基因如主營業(yè)務(wù)收入、主營業(yè)務(wù)成本、應(yīng)納稅總額、存貨余額、銷售成本、財務(wù)費用、流動資產(chǎn)合計、流動負債合計等。現(xiàn)將其中的稅收負擔率、流動比率突變?yōu)椋杭夹g(shù)投入比率、速動比率。變異后的染色體為:毛利率、技術(shù)投入比率、存貨收入比、財務(wù)費用收入比、速動比率。變異后的基因引入了其他基因,從而改變了染色體的性狀,突破了當前搜索的限制,更有利于算法尋找到全局最優(yōu)解(見圖4,略)


(三)稅收風險分析指標模型的自我優(yōu)化機制
遺傳算法可以在稅收風險分析指標模型優(yōu)化過程中發(fā)揮重要作用。在運行初期,人工智能系統(tǒng)將收集到的涉稅元數(shù)據(jù)進行隨機匹配組合,形成指標模型,由于數(shù)據(jù)的組合方式多種多樣,這個指標模型十分巨大,我們要利用遺傳算法找到最適合分析企業(yè)實際稅收風險的指標集。


第一步,系統(tǒng)隨機選取任意數(shù)量的指標并任意搭配形成一組可行解,即第一代染色體,第一代染色體并無規(guī)律可循,是隨機的。接著,我們利用適應(yīng)度函數(shù)驗證第一代染色體的可行性,檢驗這些指標集對稅收風險的反應(yīng)程度并憑此為第一代染色體打分,進而憑借適應(yīng)度分數(shù)確定第一代染色體在下一次進化迭代中被選中的概率。
第二步,開始進化過程。為了保留優(yōu)良的父代染色體,我們先將上一代中適應(yīng)度最高的幾條染色體原封不動地遺傳給下一代,這是復(fù)制過程。接著將適應(yīng)度較高的染色體進行交叉重組,形成下一代子染色體,再對新一代的子染色體進行變異操作,將組成染色體的基因隨機突變,用其他基因進行替換,形成有別于第一代染色體的基因組合,提高染色體的適用范圍。


到此為止,我們已完成第一次進化,新形成的第二代子染色體在理論上適應(yīng)度整體高于第一代染色體,遺傳下來的指標集對稅收風險的反應(yīng)程度要高于第一代隨機組合的指標集。通過計算機強大的運行能力,在多次進化迭代之后,指標集的適應(yīng)程度將會越來越高,對稅收風險的敏感度也會越來越強,無效指標會逐漸被淘汰,指標模型的覆蓋范圍亦會越來越廣,不僅能夠處理稅收風險常見問題,還能通過基因變異快速、有效地找到解決偶然問題的指標模型。此外,隨著新稅收政策的出臺,新的指標模型會出現(xiàn),原有指標模型會隨之修訂,不斷優(yōu)化的指標模型為稅收風險防范提供了一張越來越細密的網(wǎng),最終通過人工智能將納稅人涉稅風險降到最低。

三、稅收風險分析指標模型的驗證與優(yōu)化
在分析利用遺傳算法優(yōu)化指型模型時,我們提到通過適應(yīng)度函數(shù)給指標打分,從而將適應(yīng)度較低的無效指標逐漸淘汰。除此之外,我們還可以通過將指標模型代入到案例庫中,用實際案例對指標及指標模型進行檢驗和評分,達到淘汰分數(shù)較低、參考意義較小的指標,從而優(yōu)化指標模型的目的。


(一)案例庫的建立

進行案例庫驗證的前提,是要建立一個完善且典型的案例庫。這需要有一個信息收集、提取和整理的過程。在建立和完善稅收信息數(shù)據(jù)庫時,可從以下幾方面著手。
首先,要建立一個完善的全國統(tǒng)一的信息化平臺,充分利用云計算和大數(shù)據(jù)技術(shù),整合稅務(wù)機關(guān)現(xiàn)有的涉稅數(shù)據(jù)并劃分歸類,同時加強對納稅申報等信息收集的監(jiān)管力度,保證信息的準確性和即時性。其次,要建立一個完善的信息共享機制,使得公共管理資源能夠最大限度地服務(wù)稅收,并打破各行業(yè)、各地區(qū)的數(shù)據(jù)隔閡,尤其在稅務(wù)、海關(guān)、財政、銀行、外匯、統(tǒng)計、行業(yè)管理、市場監(jiān)管部門之間,要在建立信息共享和獲取機制的同時建立部門聯(lián)動數(shù)據(jù)庫。最后,要加強與第三方機構(gòu)的合作,充分挖掘各行各業(yè)的數(shù)據(jù)信息,做到信息不僅多樣而且全面。


建立案例庫時,要參考指標模型深度學(xué)習方法,通過拆解案例關(guān)鍵詞信息、自動識別和歸類,建立多維度的信息數(shù)據(jù),以有利于后續(xù)指標的代入和驗證。以某稅務(wù)機關(guān)披露的利用商標申請隱匿收入從而逃稅的案例為例。第一,要提取時間、地點等關(guān)鍵詞,確定案件所適用的法律法規(guī)。第二,要提煉出涉案主體,主要提取企業(yè)名稱。第三,要通過基于各部門之間建立的聯(lián)動數(shù)據(jù)庫,對應(yīng)到該企業(yè)的具體類型、所屬行業(yè)、行業(yè)地位、財務(wù)狀況等信息。第四,根據(jù)案件背景、“作案”手法步驟(對應(yīng)異常行為)、造成的影響和后果、相應(yīng)的處罰結(jié)果等信息,建立多維度的案例庫。第五,案例庫分解后還需要通過人工智能將文字重新組合、整理,使各種不同類型的案例標準化,建立一個標準化的、能讓計算機進行自動識別的新案例庫。這個標準化的新案例庫主要由代碼組成,以便人工智能進行后續(xù)分析和預(yù)警。


(二)指標模型在案例庫中的驗證與優(yōu)化
當納稅人案例庫建立起來后,就可以將通過遺傳算法獲得的稅收風險分析指標模型代入,以驗證其是否能夠用來分析和預(yù)測企業(yè)的稅收風險,或者驗證在企業(yè)發(fā)生稅收風險時,這些指標模型能否及時和準確地預(yù)警等。我們可以通過正向和反向的驗證,來對指標模型進行評分。評分完成后并不會就此結(jié)束,而是將這一過程循環(huán)往復(fù)地進行,直到按綜合評分篩選出最優(yōu)指標模型,并將其按實際情況修正成最符合要求的形式。此外,案例庫也要隨著稅收法律法規(guī)、政策文件的變動而實時更新變化,這就需要將指標模型代入新的案例庫進行驗證。


例如,在一個稅收案例中,某企業(yè)發(fā)生了偷逃稅行為,那么將我們的稅收風險分析指標模型代入到該企業(yè)的財務(wù)信息時,可能會發(fā)現(xiàn)我們的主要衡量指標顯示異常(關(guān)鍵指標的異常衡量較為有效地揭示了企業(yè)稅收風險的存在),或者某些重要的關(guān)鍵指標在其中并不顯著(即該指標未能向稅務(wù)機關(guān)發(fā)射出該企業(yè)存在的稅收風險信號)。根據(jù)指標顯著與否,我們可以對指標由高到低進行適當評分。當然,這樣的衡量不是以個例為定論,因為可能100家存在稅收風險的企業(yè)中,某個關(guān)鍵指標總是顯著的,而只在3家企業(yè)出現(xiàn)了例外,這時候人工智能要去尋找出現(xiàn)這種“例外”的原因是什么,可能是由于受到該企業(yè)某個其他指標的連帶影響,也可能與企業(yè)所處的特殊行業(yè)有關(guān),或者與企業(yè)內(nèi)部發(fā)展階段有關(guān),抑或只是衡量其顯著的標準必須發(fā)生的變化……總之,人工智能要能從內(nèi)而外地進行自主智能分析并記錄下這些特殊的情況,最終通過海量的大數(shù)據(jù)和案例,不斷對指標模型進行訓(xùn)練,即反復(fù)“驗證—評分—修正—再驗證—再評分—再修正”的過程,最終達到指標模型不斷完善、稅收風險分析更精準更高效之目的。


(本文為節(jié)選,原文刊發(fā)于《稅務(wù)研究》2021年第5期。)


本帖被以下淘專輯推薦:

合作請留言或郵件咨詢

1479971814@qq.com

未經(jīng)授權(quán)禁止轉(zhuǎn)載,復(fù)制和建立鏡像,
如有違反,追究法律責任
  • Tax100公眾號
Copyright © 2026 Tax100 稅百 版權(quán)所有 All Rights Reserved. Powered by Discuz! X5.1 京ICP備19053597號-1, 電話18600416813, 郵箱1479971814@qq.com
關(guān)燈 在本版發(fā)帖
Tax100公眾號
返回頂部
快速回復(fù) 返回頂部 返回列表