亚洲v欧美日韩一区|中国不卡视频免费一区二区|小黄片观看视频欧美|在线观看加勒比网站|丁香精品久久亚洲日本片|成人免费AV大片|美女婷婷综合骚妇无码|亚洲女人的大黑逼视频一区二区三区|成人操人在线播放|久久久一二三区

Tax100 稅百

標(biāo)題: 【2021年05月21日】運(yùn)用遺傳算法優(yōu)化稅收風(fēng)險(xiǎn)分析指標(biāo)模型的思考 [打印本頁]

作者: _ku78U    時(shí)間: 2021-11-4 17:11
標(biāo)題: 【2021年05月21日】運(yùn)用遺傳算法優(yōu)化稅收風(fēng)險(xiǎn)分析指標(biāo)模型的思考
運(yùn)用遺傳算法優(yōu)化稅收風(fēng)險(xiǎn)分析指標(biāo)模型的思考
李為人(中國社會(huì)科學(xué)院大學(xué)商學(xué)院)王一杰(北京市海淀區(qū)人民政府辦公室)

指標(biāo)模型是稅收風(fēng)險(xiǎn)分析的重要工具。如何建立科學(xué)、動(dòng)態(tài)、高效的指標(biāo)模型,一直是稅收風(fēng)險(xiǎn)管理部門面臨的重要課題之一。建立指標(biāo)模型的傳統(tǒng)方法依賴于專家經(jīng)驗(yàn)的積累和稅收實(shí)踐的修正,缺陷在于過程漫長(zhǎng)、內(nèi)容局限、成本較高。當(dāng)前,隨著人工智能技術(shù)的快速發(fā)展,我們可以引入人工智能領(lǐng)域的遺傳算法優(yōu)化稅收風(fēng)險(xiǎn)分析。運(yùn)用遺傳算法可以快速掃描稅收元數(shù)據(jù),遴選出有效指標(biāo),并將其隨機(jī)交叉組合,然后通過不斷變異和迭代,形成日臻完善的稅收風(fēng)險(xiǎn)指標(biāo)模型,從而快速、高效提升稅收風(fēng)險(xiǎn)管理的質(zhì)量和效率。

一、指標(biāo)模型是稅收風(fēng)險(xiǎn)分析的核心
風(fēng)險(xiǎn)分析作為稅收風(fēng)險(xiǎn)管理的核心環(huán)節(jié)之一,是指通過一定的方式方法,了解納稅人遵從稅法的不確定性程度。在稅收風(fēng)險(xiǎn)分析過程中,指標(biāo)和模型起著至關(guān)重要的作用。指標(biāo)是指預(yù)期達(dá)到的指數(shù)和標(biāo)準(zhǔn)。例如,通過“增值稅行業(yè)平均稅負(fù)率”這個(gè)指標(biāo),我們可以評(píng)判某一行業(yè)的增值稅平均稅負(fù)水平,并在此基礎(chǔ)上確定某一納稅人的增值稅稅負(fù)的偏離程度,進(jìn)而評(píng)判該納稅人風(fēng)險(xiǎn)程度的高低。模型是指由多個(gè)有共同指向性的指標(biāo)、指標(biāo)值和算法構(gòu)成的集合。例如,我們可以用行業(yè)、企業(yè)從業(yè)人員、營(yíng)業(yè)收入、資產(chǎn)總額等四個(gè)指標(biāo),評(píng)判一個(gè)企業(yè)是否符合小型微利企業(yè)的條件,判斷條件的計(jì)算機(jī)語言為“行業(yè)=非限制和禁止行業(yè)、年度應(yīng)納稅所得額≤300萬元、從業(yè)人員≤300人、資產(chǎn)總額≤5 000萬元”,這一判斷條件就是一個(gè)簡(jiǎn)單的模型。


為了得到更好的分析效果,我們需要建立多個(gè)指標(biāo)和模型,并將其存儲(chǔ)為指標(biāo)模型庫。但稅收政策、納稅人行為等因素都是在不斷變化的,這決定了指標(biāo)模型具有動(dòng)態(tài)性和復(fù)雜性,指標(biāo)模型的建設(shè)也是一個(gè)不斷優(yōu)化、持續(xù)迭代的過程。一般而言,指標(biāo)模型的建設(shè)過程首先是找來若干稅收專家,整合專家個(gè)人的工作經(jīng)驗(yàn),提出一批經(jīng)稅收實(shí)踐檢驗(yàn)過的指標(biāo),構(gòu)成初始的指標(biāo)模型1.0版;然后將指標(biāo)模型應(yīng)用于稅收風(fēng)險(xiǎn)管理實(shí)踐,根據(jù)反饋的情況不斷進(jìn)行補(bǔ)充、完善,構(gòu)成指標(biāo)模型2.0版、3.0版,以此類推。


以上這種通過吸收相關(guān)專家經(jīng)驗(yàn)成果,形成并不斷優(yōu)化指標(biāo)模型,然后將其應(yīng)用于稅收風(fēng)險(xiǎn)分析的傳統(tǒng)做法,具有一定的優(yōu)勢(shì),但其劣勢(shì)也顯而易見。

一是更新過程慢。當(dāng)前,我國經(jīng)濟(jì)轉(zhuǎn)型升級(jí)步伐不斷加快,新產(chǎn)業(yè)、新業(yè)態(tài)、新模式不斷涌現(xiàn),管理方式和運(yùn)營(yíng)模式也發(fā)生了深刻變革。這在稅收風(fēng)險(xiǎn)領(lǐng)域表現(xiàn)為納稅人應(yīng)對(duì)方式已發(fā)生改變,而風(fēng)險(xiǎn)分析的相關(guān)指標(biāo)模型還是原來的套路,即使納稅人出現(xiàn)了一定的稅收風(fēng)險(xiǎn),傳統(tǒng)的指標(biāo)模型也無法及時(shí)發(fā)現(xiàn),甚至完全失效。


二是思路范圍窄。只能對(duì)部分專家已經(jīng)了解過的知識(shí)點(diǎn)進(jìn)行歸納總結(jié),而數(shù)字經(jīng)濟(jì)快速發(fā)展所產(chǎn)生的應(yīng)用平臺(tái)如工業(yè)互聯(lián)網(wǎng)、智慧農(nóng)業(yè)平臺(tái)往往會(huì)產(chǎn)生龐雜的數(shù)據(jù),專家的知識(shí)儲(chǔ)備及人工分析無法全面涉及。除此之外,由互聯(lián)網(wǎng)推動(dòng)的一二三產(chǎn)業(yè)的融合發(fā)展,也會(huì)使得傳統(tǒng)的指標(biāo)模型生成方法缺乏發(fā)現(xiàn)更大范圍相關(guān)數(shù)據(jù)的能力。


三是工作成本高。新的政策出臺(tái),新產(chǎn)業(yè)、新業(yè)態(tài)、新模式的快速產(chǎn)生與發(fā)展往往需要再集中專家力量制發(fā)新的指標(biāo)模型,這會(huì)產(chǎn)生較高的組織和經(jīng)濟(jì)成本?;诖?,我們需要探索更為快速、有效的指標(biāo)模型生成方法。

二、遺傳算法與稅收風(fēng)險(xiǎn)分析指標(biāo)模型的有機(jī)結(jié)合
作為稅收風(fēng)險(xiǎn)分析的重要工具,指標(biāo)模型的有效性直接決定了重大稅收風(fēng)險(xiǎn)的防范和化解水平,而指標(biāo)模型是否處于持續(xù)優(yōu)化狀態(tài)直接決定了稅收風(fēng)險(xiǎn)分析系統(tǒng)是否處于穩(wěn)定運(yùn)行狀態(tài)。當(dāng)前,經(jīng)濟(jì)社會(huì)的發(fā)展對(duì)稅收風(fēng)險(xiǎn)分析系統(tǒng)的沖擊使得傳統(tǒng)的指標(biāo)模型在應(yīng)對(duì)風(fēng)險(xiǎn)變化上心有余而力不足,如何化危為機(jī),關(guān)鍵在于能否構(gòu)建可以快速更迭、與時(shí)俱進(jìn)的指標(biāo)模型,而大數(shù)據(jù)和人工智能算法的不斷發(fā)展給我們帶來了重要轉(zhuǎn)機(jī)。


(一)遺傳算法的基本原理
  人工智能算法隨著技術(shù)的發(fā)展變得復(fù)雜且多樣,其基礎(chǔ)算法中的遺傳算法更加適合當(dāng)前稅收風(fēng)險(xiǎn)指標(biāo)模型動(dòng)態(tài)優(yōu)化系統(tǒng)的構(gòu)建。所謂遺傳算法(Genetic Algorithm,GA),是指模擬達(dá)爾文生物進(jìn)化論的自然選擇和遺傳學(xué)機(jī)理的生物進(jìn)化過程的計(jì)算模型,是一種通過模擬自然進(jìn)化過程搜索最優(yōu)解的方法。遺傳算法其本質(zhì)所展現(xiàn)的就是優(yōu)勝劣汰效應(yīng),不斷篩選出最優(yōu)秀的個(gè)體,在整個(gè)“進(jìn)化”過程中,“最優(yōu)”不是恒定不變的,而是不斷發(fā)展和更新的。遺傳算法的內(nèi)在運(yùn)行機(jī)制能夠使得指標(biāo)模型不斷進(jìn)行自我迭代,通過內(nèi)設(shè)的適應(yīng)度函數(shù)對(duì)指標(biāo)優(yōu)勝劣汰,把適合目標(biāo)要求的指標(biāo)保留下來,把無效或者次要的指標(biāo)排除掉。


與傳統(tǒng)算法不同,遺傳算法不以單個(gè)初始值進(jìn)行迭代求取最優(yōu)解,而是以群體中所有個(gè)體為對(duì)象,利用概率(Pm)的變遷規(guī)則以及隨機(jī)化技術(shù)對(duì)編碼的參數(shù)空間進(jìn)行隨機(jī)搜索,以有效避免傳統(tǒng)算法易于陷入局部最優(yōu)解的困境,同時(shí)也易于實(shí)現(xiàn)并行化從而大幅提高全局搜索能力。遺傳算法可以通過適應(yīng)度函數(shù)直接對(duì)結(jié)構(gòu)對(duì)象進(jìn)行操作,基本不需要搜尋空間知識(shí)以及輔助信息,且適應(yīng)度函數(shù)不存在求導(dǎo)和函數(shù)連續(xù)性的限定,其定義域也可以任意設(shè)定,這就使得遺傳算法的應(yīng)用范圍得到了極大的拓展。參數(shù)編碼、初始群體的設(shè)定、適應(yīng)度函數(shù)的設(shè)計(jì)、遺傳操作設(shè)計(jì)、控制參數(shù)設(shè)定共同構(gòu)成遺傳算法的整體架構(gòu),而遺傳操作主要包括選擇、交叉及變異三種算法(見圖1,略)。


(二)遺傳算法與稅收風(fēng)險(xiǎn)分析指標(biāo)模型的結(jié)合
  通過對(duì)遺傳算法基本原理和傳統(tǒng)意義上的指標(biāo)模型建設(shè)過程的簡(jiǎn)要介紹,我們可以發(fā)現(xiàn),二者具有天然的相似性。一是具有共同的工作機(jī)理。遺傳算法的原理是通過組合不同的基因構(gòu)成染色體,形成不同的個(gè)體,個(gè)體在實(shí)際環(huán)境中得到檢驗(yàn),適應(yīng)的被留下,不適應(yīng)的被淘汰,如此循環(huán)往復(fù)、不斷優(yōu)化。指標(biāo)模型也是通過組合不同的元數(shù)據(jù),如銷售收入、應(yīng)繳增值稅等信息系統(tǒng)中最基礎(chǔ)的數(shù)據(jù)單位,形成指標(biāo)模型,指標(biāo)模型在稅收實(shí)踐中被檢驗(yàn),有用的被留下,沒用的被淘汰,最終形成日漸精準(zhǔn)的指標(biāo)模型庫。二是具有共同的復(fù)雜性。遺傳算法的基因數(shù)據(jù)量龐大,凡是與目標(biāo)相關(guān)的因素全部納入計(jì)算范圍。稅收風(fēng)險(xiǎn)分析的指標(biāo)模型建設(shè)與之相類似,也要考慮全部稅收及財(cái)務(wù)指標(biāo)。三是具有共同的突變處理機(jī)制。遺傳算法中有選擇、交叉和變異三種基本算法,其中,變異是指因內(nèi)部或外部原因造成的染色體的變化。風(fēng)險(xiǎn)指標(biāo)模型建設(shè)中也有類似過程,如稅收政策的改變帶來部分指標(biāo)模型的變化,某個(gè)典型的稅收分析案例發(fā)現(xiàn)了新的指標(biāo),等等。


在遺傳算法運(yùn)行初期,人工智能系統(tǒng)就像“剛出生的嬰兒”,需要不斷被“喂食”,而這食物就是我們所說的元數(shù)據(jù)。得到了“食物”之后,人工智能系統(tǒng)才有可能開始自己學(xué)習(xí),慢慢成長(zhǎng)為一個(gè)有智慧的“人”。在遺傳算法中,人工智能逐漸變得“聰明”的過程稱之為迭代。如在稅收風(fēng)險(xiǎn)分析中,初期人工智能系統(tǒng)將稅收元數(shù)據(jù)隨機(jī)匹配成指標(biāo),再選取隨機(jī)數(shù)量的指標(biāo)形成一個(gè)指標(biāo)集,即一條染色體,接著我們通過迭代的方式使之“進(jìn)化”產(chǎn)生新的染色體,這個(gè)產(chǎn)生新染色體的過程我們稱之為基因重組。


遺傳算法在運(yùn)行初期所產(chǎn)生的初代指標(biāo)集,是計(jì)算機(jī)根據(jù)概率隨機(jī)組成的,因此,并不具有代表意義,要想使指標(biāo)模型優(yōu)化進(jìn)而達(dá)到能夠有效分析稅收風(fēng)險(xiǎn)的目的,就要不斷產(chǎn)生新的指標(biāo)集。在以往稅收風(fēng)險(xiǎn)分析指標(biāo)的構(gòu)建中,這個(gè)程序往往是通過人工篩選提煉的方式進(jìn)行,過程漫長(zhǎng)且具有不確定性,滯后于實(shí)際變化。而通過基因重組程序,可以將父代指標(biāo)集進(jìn)行切割、重組,從而自我形成新的指標(biāo)集,雖然這個(gè)過程仍然存在隨機(jī)性,但通過適應(yīng)度函數(shù)和計(jì)算機(jī)的強(qiáng)大運(yùn)行能力,在多次迭代后產(chǎn)生的后代指標(biāo)集會(huì)逐步優(yōu)化。稅收風(fēng)險(xiǎn)分析指標(biāo)模型的遺傳算法主要操作包括選擇、交叉和變異,以下分別說明。
1.選擇。選擇是指從群體中選擇優(yōu)良的個(gè)體并淘汰劣質(zhì)個(gè)體的操作。這一操作是建立在適應(yīng)度評(píng)估的基礎(chǔ)上的。一般而言,適應(yīng)度越大的個(gè)體,被選擇的可能性就越大,其后代就越多,但并非適應(yīng)度越高的后代肯定就越多,只能從概率上而言更多。那么,我們?nèi)绾谓⑦@種概率關(guān)系來選取父染色體和母染色體呢?目前常用的選擇方法有輪盤賭算法、最佳個(gè)體保留法、期望值法、排序選擇法、競(jìng)爭(zhēng)法、線性標(biāo)準(zhǔn)化法等。本文以常用的選擇方法——輪盤賭算法(Roulette WheelSelection)為例進(jìn)行說明。

輪盤賭算法的基本思想是個(gè)體被選中的概率與其適應(yīng)度函數(shù)值成正比。


假設(shè)群體大小為n,個(gè)體i的適應(yīng)度為Fi,則個(gè)體i被選中遺傳到下一代群體的概率為:p= Fi÷ΣFi。
每次進(jìn)化后我們都要通過適應(yīng)度函數(shù)計(jì)算新染色體的適應(yīng)度。設(shè)想群體全部個(gè)體的適應(yīng)度分?jǐn)?shù)用一張餅圖來表示(如圖2所示,略)。

餅圖中每一個(gè)小塊即代表群體中每一條染色體,塊的大小與染色體的適應(yīng)度成正比,適應(yīng)度越高,它在餅圖中對(duì)應(yīng)的小塊所占面積也越大。為了選取一條染色體,要做的就是旋轉(zhuǎn)這個(gè)輪子,直到輪盤停止時(shí),看指針停止在哪一塊上,就選中與之對(duì)應(yīng)的那條染色體。因此,適應(yīng)度越高的染色體便越有可能被選為父(母)染色體,這也就是為什么遺傳算法能保留優(yōu)良基因的原因。


在運(yùn)用遺傳算法構(gòu)建稅收風(fēng)險(xiǎn)分析指標(biāo)模型過程中,如何通過算法來保留有效指標(biāo)不被淘汰是關(guān)鍵問題之一。在計(jì)算機(jī)世界中,對(duì)一個(gè)問題的評(píng)價(jià)往往是通過概率的形式進(jìn)行的,優(yōu)與良對(duì)應(yīng)著概率的高與低。通過適應(yīng)度函數(shù)我們可以評(píng)價(jià)迭代產(chǎn)生的指標(biāo)集,并為其打分,單個(gè)指標(biāo)集所獲得的分?jǐn)?shù)就是決定其迭代過程中被選取概率的分子,而分母則是所有指標(biāo)集所獲得的分?jǐn)?shù)的總和。通過這個(gè)概率我們可以決定被評(píng)價(jià)的指標(biāo)集在下一輪迭代中“存活”的機(jī)會(huì)。但概率終究會(huì)出現(xiàn)偏差,即使某個(gè)指標(biāo)集存活的概率達(dá)到99%,依然有1%的概率在下一輪迭代中不被選到。為了解決這個(gè)問題,我們運(yùn)用微生物遺傳算法的概念,將評(píng)分較高的指標(biāo)集直接復(fù)制給下一代,這樣就可以保證有效指標(biāo)的存活,從而提高后代指標(biāo)集的有效性。


2.交叉。交叉操作是遺傳算法獲取優(yōu)良個(gè)體的重要手段,可以大大提高遺傳算法的搜索能力。運(yùn)行過程中我們選取兩條父代染色體,可以理解為父染色體和母染色體,接著將兩個(gè)父代個(gè)體的部分結(jié)構(gòu)加以替換重組,形成一條子染色體,這條子染色體既包含父染色體的一部分也包含母染色體的一部分,這就是新染色體形成的過程。交叉操作按照事先設(shè)定好的概率(交叉概率一般取較大值,通常為0.6~0.9)在風(fēng)險(xiǎn)指標(biāo)庫中隨機(jī)選取兩條染色體并且在隨機(jī)位置進(jìn)行交叉重組。舉例而言,在遺傳算法運(yùn)行初期,計(jì)算機(jī)會(huì)隨機(jī)創(chuàng)建初始化種群,種群由大量隨機(jī)產(chǎn)生的染色體組成,計(jì)算機(jī)隨機(jī)選取兩個(gè)具有各自特征的指標(biāo)集(兩條染色體)。(1)父染色體:毛利率、稅收負(fù)擔(dān)率、存貨收入比……銷售成本率、工資費(fèi)用。(2)母染色體:原材料成本率、銷售利潤(rùn)率、存貨周轉(zhuǎn)率……財(cái)務(wù)費(fèi)用收入比、流動(dòng)比率。遺傳算法程序?qū)⒏复旧w在第三個(gè)指標(biāo)處切斷,將母代染色體在倒數(shù)第五個(gè)指標(biāo)處切斷,在兩者切斷處重組,就可以形成一條新的子染色體:毛利率、稅收負(fù)擔(dān)率、存貨收入比、財(cái)務(wù)費(fèi)用收入比、流動(dòng)比率(詳見圖3,略)。

盡管輪盤賭算法可以保證優(yōu)良基因的代代相傳,但并不能保證通過交叉重組形成的子染色體的適應(yīng)度高于父母染色體,為了解決這個(gè)問題,我們引入微生物遺傳算法(Microbial GA)這個(gè)概念,主要解決遺傳算法中無法有效保留“好父母”的問題,即無論“父母”多么優(yōu)秀,都不會(huì)被保留,只能將各自基因的一部分進(jìn)行基因重組,但基因重組后的子代染色體并不一定優(yōu)于“父母”。此過程是通過迭代將染色體中表現(xiàn)好的基因不作任何改變放入子代染色體中,這樣可以避免交叉重組之后染色體適應(yīng)度低于“父母”染色體所產(chǎn)生的不良后果,最大限度地保證染色體的質(zhì)量。


實(shí)際上,這個(gè)過程在計(jì)算機(jī)的運(yùn)行中并不需要很長(zhǎng)時(shí)間,且計(jì)算機(jī)可以全天候運(yùn)行,效率遠(yuǎn)遠(yuǎn)高于人力手段,可充分保證交叉程序的時(shí)效性和有效性。不僅如此,自我產(chǎn)生數(shù)據(jù)且自我分析學(xué)習(xí)數(shù)據(jù)也是人工智能超越以往計(jì)算機(jī)技術(shù)的一個(gè)重要方面,遺傳算法的交叉程序可以通過父代指標(biāo)集自動(dòng)生成新一代子指標(biāo)集,這就是人工智能自我產(chǎn)生數(shù)據(jù)的過程。與此同時(shí),遺傳算法的交叉程序還可以通過適應(yīng)度函數(shù)不斷評(píng)價(jià)產(chǎn)生的指標(biāo)集的有效性,這是人工智能自我學(xué)習(xí)分析數(shù)據(jù)的過程??梢哉f,遺傳算法是人工智能領(lǐng)域一個(gè)有效的智能算法,在稅收風(fēng)險(xiǎn)指標(biāo)模型構(gòu)建中發(fā)揮著重要作用。


3.變異。在遺傳算法中,變異是很重要的一步,原因是選擇和交叉只能保證原有優(yōu)良基因的保留。通過輪盤賭算法將原有的指標(biāo)集中有用的指標(biāo)傳承下去,染色體中的基因并沒有改變,只是通過改變排列組合的方式讓指標(biāo)集變得更加符合實(shí)際問題的解決。但這就存在一個(gè)問題,通過交叉機(jī)制只能保證經(jīng)過n 次進(jìn)化后,計(jì)算結(jié)果更接近于局部最優(yōu)解,而永遠(yuǎn)沒辦法達(dá)到全局最優(yōu)解,并且會(huì)造成某些有效信息指標(biāo)的永久缺失。人工智能系統(tǒng)要想完全獨(dú)立分析必須通過自己的機(jī)制找到全局最優(yōu)解。如果僅是原有指標(biāo)集的優(yōu)化升級(jí),只能解決大部分一般性的情況,而小部分具有特殊性的問題需要特殊的指標(biāo)集進(jìn)行處理,而此時(shí)引入基因變異則是最好的解決辦法。
遺傳算法中的變異過程與自然界的基因突變類似,即以很小的變異概率隨機(jī)地改變?nèi)旧w中某些基因的值。變異操作的基本過程是:產(chǎn)生一個(gè)[0,1] 之間的隨機(jī)數(shù)(rand),若rand<Pm,則進(jìn)行變異操作,隨機(jī)選擇子染色體上的部分基因,用基因庫中的其他基因?qū)⑵浯?,從而給現(xiàn)有的染色體引入新的基因。在變異操作中,選擇的變異概率盡可能低,通常取0.000 1~0.1,否則遺傳算法就退化成了隨機(jī)搜索。以前文例子進(jìn)一步舉例而言。


提取基因重組過程產(chǎn)生的子染色體:毛利率、稅收負(fù)擔(dān)率、存貨收入比、財(cái)務(wù)費(fèi)用收入比、流動(dòng)比率。子染色體中包含許多基因如主營(yíng)業(yè)務(wù)收入、主營(yíng)業(yè)務(wù)成本、應(yīng)納稅總額、存貨余額、銷售成本、財(cái)務(wù)費(fèi)用、流動(dòng)資產(chǎn)合計(jì)、流動(dòng)負(fù)債合計(jì)等?,F(xiàn)將其中的稅收負(fù)擔(dān)率、流動(dòng)比率突變?yōu)椋杭夹g(shù)投入比率、速動(dòng)比率。變異后的染色體為:毛利率、技術(shù)投入比率、存貨收入比、財(cái)務(wù)費(fèi)用收入比、速動(dòng)比率。變異后的基因引入了其他基因,從而改變了染色體的性狀,突破了當(dāng)前搜索的限制,更有利于算法尋找到全局最優(yōu)解(見圖4,略)


(三)稅收風(fēng)險(xiǎn)分析指標(biāo)模型的自我優(yōu)化機(jī)制
遺傳算法可以在稅收風(fēng)險(xiǎn)分析指標(biāo)模型優(yōu)化過程中發(fā)揮重要作用。在運(yùn)行初期,人工智能系統(tǒng)將收集到的涉稅元數(shù)據(jù)進(jìn)行隨機(jī)匹配組合,形成指標(biāo)模型,由于數(shù)據(jù)的組合方式多種多樣,這個(gè)指標(biāo)模型十分巨大,我們要利用遺傳算法找到最適合分析企業(yè)實(shí)際稅收風(fēng)險(xiǎn)的指標(biāo)集。


第一步,系統(tǒng)隨機(jī)選取任意數(shù)量的指標(biāo)并任意搭配形成一組可行解,即第一代染色體,第一代染色體并無規(guī)律可循,是隨機(jī)的。接著,我們利用適應(yīng)度函數(shù)驗(yàn)證第一代染色體的可行性,檢驗(yàn)這些指標(biāo)集對(duì)稅收風(fēng)險(xiǎn)的反應(yīng)程度并憑此為第一代染色體打分,進(jìn)而憑借適應(yīng)度分?jǐn)?shù)確定第一代染色體在下一次進(jìn)化迭代中被選中的概率。
第二步,開始進(jìn)化過程。為了保留優(yōu)良的父代染色體,我們先將上一代中適應(yīng)度最高的幾條染色體原封不動(dòng)地遺傳給下一代,這是復(fù)制過程。接著將適應(yīng)度較高的染色體進(jìn)行交叉重組,形成下一代子染色體,再對(duì)新一代的子染色體進(jìn)行變異操作,將組成染色體的基因隨機(jī)突變,用其他基因進(jìn)行替換,形成有別于第一代染色體的基因組合,提高染色體的適用范圍。


到此為止,我們已完成第一次進(jìn)化,新形成的第二代子染色體在理論上適應(yīng)度整體高于第一代染色體,遺傳下來的指標(biāo)集對(duì)稅收風(fēng)險(xiǎn)的反應(yīng)程度要高于第一代隨機(jī)組合的指標(biāo)集。通過計(jì)算機(jī)強(qiáng)大的運(yùn)行能力,在多次進(jìn)化迭代之后,指標(biāo)集的適應(yīng)程度將會(huì)越來越高,對(duì)稅收風(fēng)險(xiǎn)的敏感度也會(huì)越來越強(qiáng),無效指標(biāo)會(huì)逐漸被淘汰,指標(biāo)模型的覆蓋范圍亦會(huì)越來越廣,不僅能夠處理稅收風(fēng)險(xiǎn)常見問題,還能通過基因變異快速、有效地找到解決偶然問題的指標(biāo)模型。此外,隨著新稅收政策的出臺(tái),新的指標(biāo)模型會(huì)出現(xiàn),原有指標(biāo)模型會(huì)隨之修訂,不斷優(yōu)化的指標(biāo)模型為稅收風(fēng)險(xiǎn)防范提供了一張?jiān)絹碓郊?xì)密的網(wǎng),最終通過人工智能將納稅人涉稅風(fēng)險(xiǎn)降到最低。

三、稅收風(fēng)險(xiǎn)分析指標(biāo)模型的驗(yàn)證與優(yōu)化
在分析利用遺傳算法優(yōu)化指型模型時(shí),我們提到通過適應(yīng)度函數(shù)給指標(biāo)打分,從而將適應(yīng)度較低的無效指標(biāo)逐漸淘汰。除此之外,我們還可以通過將指標(biāo)模型代入到案例庫中,用實(shí)際案例對(duì)指標(biāo)及指標(biāo)模型進(jìn)行檢驗(yàn)和評(píng)分,達(dá)到淘汰分?jǐn)?shù)較低、參考意義較小的指標(biāo),從而優(yōu)化指標(biāo)模型的目的。


(一)案例庫的建立

進(jìn)行案例庫驗(yàn)證的前提,是要建立一個(gè)完善且典型的案例庫。這需要有一個(gè)信息收集、提取和整理的過程。在建立和完善稅收信息數(shù)據(jù)庫時(shí),可從以下幾方面著手。
首先,要建立一個(gè)完善的全國統(tǒng)一的信息化平臺(tái),充分利用云計(jì)算和大數(shù)據(jù)技術(shù),整合稅務(wù)機(jī)關(guān)現(xiàn)有的涉稅數(shù)據(jù)并劃分歸類,同時(shí)加強(qiáng)對(duì)納稅申報(bào)等信息收集的監(jiān)管力度,保證信息的準(zhǔn)確性和即時(shí)性。其次,要建立一個(gè)完善的信息共享機(jī)制,使得公共管理資源能夠最大限度地服務(wù)稅收,并打破各行業(yè)、各地區(qū)的數(shù)據(jù)隔閡,尤其在稅務(wù)、海關(guān)、財(cái)政、銀行、外匯、統(tǒng)計(jì)、行業(yè)管理、市場(chǎng)監(jiān)管部門之間,要在建立信息共享和獲取機(jī)制的同時(shí)建立部門聯(lián)動(dòng)數(shù)據(jù)庫。最后,要加強(qiáng)與第三方機(jī)構(gòu)的合作,充分挖掘各行各業(yè)的數(shù)據(jù)信息,做到信息不僅多樣而且全面。


建立案例庫時(shí),要參考指標(biāo)模型深度學(xué)習(xí)方法,通過拆解案例關(guān)鍵詞信息、自動(dòng)識(shí)別和歸類,建立多維度的信息數(shù)據(jù),以有利于后續(xù)指標(biāo)的代入和驗(yàn)證。以某稅務(wù)機(jī)關(guān)披露的利用商標(biāo)申請(qǐng)隱匿收入從而逃稅的案例為例。第一,要提取時(shí)間、地點(diǎn)等關(guān)鍵詞,確定案件所適用的法律法規(guī)。第二,要提煉出涉案主體,主要提取企業(yè)名稱。第三,要通過基于各部門之間建立的聯(lián)動(dòng)數(shù)據(jù)庫,對(duì)應(yīng)到該企業(yè)的具體類型、所屬行業(yè)、行業(yè)地位、財(cái)務(wù)狀況等信息。第四,根據(jù)案件背景、“作案”手法步驟(對(duì)應(yīng)異常行為)、造成的影響和后果、相應(yīng)的處罰結(jié)果等信息,建立多維度的案例庫。第五,案例庫分解后還需要通過人工智能將文字重新組合、整理,使各種不同類型的案例標(biāo)準(zhǔn)化,建立一個(gè)標(biāo)準(zhǔn)化的、能讓計(jì)算機(jī)進(jìn)行自動(dòng)識(shí)別的新案例庫。這個(gè)標(biāo)準(zhǔn)化的新案例庫主要由代碼組成,以便人工智能進(jìn)行后續(xù)分析和預(yù)警。


(二)指標(biāo)模型在案例庫中的驗(yàn)證與優(yōu)化
當(dāng)納稅人案例庫建立起來后,就可以將通過遺傳算法獲得的稅收風(fēng)險(xiǎn)分析指標(biāo)模型代入,以驗(yàn)證其是否能夠用來分析和預(yù)測(cè)企業(yè)的稅收風(fēng)險(xiǎn),或者驗(yàn)證在企業(yè)發(fā)生稅收風(fēng)險(xiǎn)時(shí),這些指標(biāo)模型能否及時(shí)和準(zhǔn)確地預(yù)警等。我們可以通過正向和反向的驗(yàn)證,來對(duì)指標(biāo)模型進(jìn)行評(píng)分。評(píng)分完成后并不會(huì)就此結(jié)束,而是將這一過程循環(huán)往復(fù)地進(jìn)行,直到按綜合評(píng)分篩選出最優(yōu)指標(biāo)模型,并將其按實(shí)際情況修正成最符合要求的形式。此外,案例庫也要隨著稅收法律法規(guī)、政策文件的變動(dòng)而實(shí)時(shí)更新變化,這就需要將指標(biāo)模型代入新的案例庫進(jìn)行驗(yàn)證。


例如,在一個(gè)稅收案例中,某企業(yè)發(fā)生了偷逃稅行為,那么將我們的稅收風(fēng)險(xiǎn)分析指標(biāo)模型代入到該企業(yè)的財(cái)務(wù)信息時(shí),可能會(huì)發(fā)現(xiàn)我們的主要衡量指標(biāo)顯示異常(關(guān)鍵指標(biāo)的異常衡量較為有效地揭示了企業(yè)稅收風(fēng)險(xiǎn)的存在),或者某些重要的關(guān)鍵指標(biāo)在其中并不顯著(即該指標(biāo)未能向稅務(wù)機(jī)關(guān)發(fā)射出該企業(yè)存在的稅收風(fēng)險(xiǎn)信號(hào))。根據(jù)指標(biāo)顯著與否,我們可以對(duì)指標(biāo)由高到低進(jìn)行適當(dāng)評(píng)分。當(dāng)然,這樣的衡量不是以個(gè)例為定論,因?yàn)榭赡?00家存在稅收風(fēng)險(xiǎn)的企業(yè)中,某個(gè)關(guān)鍵指標(biāo)總是顯著的,而只在3家企業(yè)出現(xiàn)了例外,這時(shí)候人工智能要去尋找出現(xiàn)這種“例外”的原因是什么,可能是由于受到該企業(yè)某個(gè)其他指標(biāo)的連帶影響,也可能與企業(yè)所處的特殊行業(yè)有關(guān),或者與企業(yè)內(nèi)部發(fā)展階段有關(guān),抑或只是衡量其顯著的標(biāo)準(zhǔn)必須發(fā)生的變化……總之,人工智能要能從內(nèi)而外地進(jìn)行自主智能分析并記錄下這些特殊的情況,最終通過海量的大數(shù)據(jù)和案例,不斷對(duì)指標(biāo)模型進(jìn)行訓(xùn)練,即反復(fù)“驗(yàn)證—評(píng)分—修正—再驗(yàn)證—再評(píng)分—再修正”的過程,最終達(dá)到指標(biāo)模型不斷完善、稅收風(fēng)險(xiǎn)分析更精準(zhǔn)更高效之目的。


(本文為節(jié)選,原文刊發(fā)于《稅務(wù)研究》2021年第5期。)







歡迎光臨 Tax100 稅百 (http://www.hjtg28.cn/) Powered by Discuz! X5.1