设置首页 入收藏 English 可做什么 帮助 | XBRL中国 会计准则委员会

税务局如何应用网络爬虫技术获取企业涉税信息

陶国军 / 2017-09-25
文字 正常
  • 标签:
  • 爬虫
  • 税务杂谈
  •  
  • 声明:本文由会说作者撰写,观点仅代表个人,不代表中国会计视野。文中部分图片来自于网络,感谢原作者。
    未来企业的税务风险暴露机会将会越来越大,那种以违规手段达到少缴税的手法将很难有生存空间,而合法(利用税收优惠政策)、合理(符合商业目的)的税务筹划将是未来企业节税的主要途径。

    在互联网上,经常能看到某某税务局利用网络爬虫技术发现某某企业涉税问题,并进一步被查处的信息。

    那么,什么是网络爬虫呢?税务局如何应用网络爬虫技术发现企业的涉税疑点呢?本文将带你一步一步解开其中的奥秘。

     

    网络爬虫也称“网页蜘蛛”,是一个自动提取网页的程序传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL,并重复上述过程,直到达到系统的某一条件时停止,另外,所有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索

    以上是引自网络专业的表述,简单的说,“网络爬虫”是一个自动提取网页的程序,运用“网络爬虫”技术设定程序,可以根据既定的目标更加精准选择抓取相关的网页信息,有助于在互联网海量信息中快捷获取有用的涉税信息。

     

    税务局如何借助网络爬虫开展工作呢概括的说,不外乎这样几个方面:

    一是有针对性的捕捉互联网上的企业相关信息;

    二是借助大数据,整合其他相关涉税信息;

    三是通过一系列预警指标分析比对筛选案源;

    四是重构企业交易行为轨迹,定位税收风险疑点。

    其实,网络爬虫搜集的仅仅是纳税人公开在网络上的涉税信息,税务机关获取纳税人的涉税信息还有很多途径,比如,利用内部风控中心监控平台,与网络运营商、工商、统计、建设、技术监督、财政、公安、海关、金融机构、外汇管理、国土规划和物流中心等有关部门联网实现信息互通、数据互联、资源共享,并整合纳税人联网开票信息、申报数据、税款缴纳数据、财务报表数据、重点税源报表数据、备案信息等数据信息,实时更新纳税人信息库,使纳税人时时处在金税三期强大的监控和预警范围之内。

    所以,如果有一天,税务局直接找上门来或电话问询企业税务疑点,不要觉得奇怪。

    随着税务机关信息化手段的不断强化、税务稽查检查人员能力素质的不断提升,未来企业的税务风险暴露机会将会越来越大,那种以违规手段达到少缴税的手法将很难有生存空间,而合法(利用税收优惠政策)、合理(符合商业目的)的税务筹划将是未来企业节税的主要途径

    陶国军桃子说税

    作者
    • 陶国军 拥有二十年税务系统工作经验,对财税理论与实务有较深的研究和体会。
      微信公众号:桃子说税
    热门作者
    • 吾税老师 兼职培训师、总局大比武纳服类第一名
    • 丁坤 注册税务师,省企业所得税人才库、反避税人才库成员...
    • 范晓东 中欧商学院、高顿商学院讲师;财务第一教室高级讲师...
    • 尹成彦 原注册会计视野网创始成员、站长; 中国会计视野创...
    热门文章查看更多>
    视野官方微信公众号
    扫描二维码,订阅视野微信,
    每日获取最新会计资讯
    视野官方APP免费下载
    会计资讯、财经法规快查、
    会计视野论坛三大APP
    订阅视野周刊
    每周十分钟,尽知行业事
    立即订阅
    阅读平台上看视野
    网易云阅读
    鲜果 Zaker
    上海国家会计学院旗下更多网站:学院主页  上海国家会计学院远程教育网  亚太财经与发展学院
    联系电话:021-69768000-68069(内容)68246(合作/广告)68247(用户/社区)  工作时间:8:30-16:30  webmaster@esnai.com
    增值电信业务经营许可证:沪B2-20100028 沪ICP备05013522号

    沪公网安备 31011802001002号