Categories
事儿关经济

个人收入税与消费税

总觉得我以前在落园写过这个话题,结果自己没搜到,只是两年前简略地讲了一下美国的养老金而已。那就把这个还蛮有意思的话题也写写吧。

这个话题其实是去年年底在智利的时候,无意中混入了一群智利税务局职员的日常烤肉趴。别看我西语磕磕绊绊,还喝得醉醺醺的,谈到税务那我立马就来了精神,怎么也要掺合一下。

那几位老兄谈及智利在辩论现行的向个人收税的制度,是应该以消费税还是收入税为主?收入税大家都比较熟悉,一般是工资就直接被扣完了,美国等国家还有臭名昭著的4月15报税日。消费税很多时候不注意都察觉不到,美国还好,一般价签是税前价,然后一结账才能看到消费税。这主要是消费税在美国属于地方税而非联邦税,所以才有大家跑到免税州购物。中国大部分价签都是含税价,不仔细看发票可能都没意识到税率到底有多高。

智利的消费税以增值税形式出现,达到了惊人的20%。对于个人消费者来说,不存在增值税进项抵扣这一说,所以就是全额承担了。

中国的消费税这些年也被改革成了增值税,平均可能有17%,基本上都是奢侈品税的概念了。有意思的是卫生巾居然被归为增值税意义上的奢侈品,适用13%的税率。记得好像是历史遗留原因,不知道过些年会不会考虑国情进行调整。搜了一下现在婴儿纸尿裤的税率已经降到9%了(来源)。

美国的消费税极其复杂,有州、市、县等等多层。加州基本是9%左右,食品之类不征税,卫生巾现在也不征税了。芝加哥所在的伊利诺伊州消费税好像有11%,算是我印象中比较高的了。除了消费税之外,美国还有臭名昭著的房产税,也是州税。但与此同时,股票作为资产,只持有是没有税的。君不见首富马斯克“被迫”卖掉房产还贷款,然后股票资产做抵押贷款去消费。后面对加州忍无可忍,直接搬家到没有收入税的德州去了。简直是把税法吃得透透的。

智利在讨论增值税向收入税转变的主要原因是,消费税其实是向穷人征税,因为他们消费占收入的比例远远高于富人对应的比例。而收入税的设计则是保护穷人,更多地向富人收取。从社会公平和财富再分配的角度来说,收入税似乎更为公平?然而理论只是理论,实际操作中我们发现,美国的个税变成了向中产阶级征税,穷富两头反而都不怎么需要交税。上面的事实证明,成为美国首富不仅要才智过人,还要搞得定美国税务局和证监会。收入税其实起作用的只是劳动收入(发出来的工资),而对于资产收入并无太多作用。

那么既然收入税比消费税公平,为什么我们不完全用收入税取代消费税呢?除了上面说到的实践中合理避税的问题,还有一个社会层面的衡量就是人们劳动参与的积极性。前面的例子说到,人们对于收入税的感知是极为直接的,所以一旦税率上升,人们的本能反应就是调整工作时间,并没有激励超额劳动。消费税在某种意义上更缺乏弹性,一方面是很多消费是固定消费没法调整,另一方面则是“棘轮效应”——由俭入奢易,由奢入俭难。人果然是一种好逸恶劳的生物。Saez这一课有深入讲各种最优个税税率设计的想法,有兴趣者不妨继续阅读。

那么大家继续想,既然向个人征税怎么都有问题,那为什么不取而代之向公司征税呢,这不就避免了各种问题吗?可惜的是,公司税也不是那么好征的。首先,对于企业家们来说,他们是可以选择把收入在个人和公司之间分配的,一旦公司税税率高,那么收入就会转化到个人收入这边,然后通过个人投资的方式重新进入公司的资金流。其次,公司税无法避免国界。前几年轰轰烈烈的“避税天堂”不就是跨国公司实现资产全球配置的实例吗?除此之外,Saez还有讲到公司税对于公司借贷行为的影响。亚马逊这么多年负利润,华尔街还趋之若鹜,难道大家都是梦想家吗?资产税同理,只要这个世界上不止一个国家,流动性较强的资产就没办法征税。

税收本身作为一门课程很无聊,因为国内基本上是作为注册会计师或者法学讲法,考虑实践中怎么进行财务操作。然而若是把税收作为一门机制设计来思考,那就其乐无穷了。猫和老鼠的游戏,现实版的一例例日后被载入教科书,不仅仅是经济效率还有社会公平的各种考量,国家治理颇为一门学问。

Categories
事儿关经济

经济危机和经济衰退对于个体的一些影响

学宏观经济学的时候,就算是入门的课程,多多少少大家都会学过一些经济周期模型,最有名的可能是“熊彼特经济周期”?经济周期其实是个很泛泛的定义,但至少周期两个字说明了这是一个有起有落的过程,而不是一味地单调上升或者下降。那么,既然有周期,就有相应的经济危机,比如08年的次贷危机,比如97年的亚洲金融风暴。经济危机造成的后果自然就是经济衰退了。

那么这一次新冠病毒算不算经济危机呢?至今,或许还没有一个明确的答案。它来势汹汹,搞得我们措手不及,却不是直接在经济系统本身爆发。它导致大家停业歇工,所以生产和消费双双下降,GDP的数字自然下降。但可能大家感觉起来,这个冲击是对不同人群不同力度的。多亏互联网发展,能远程办公的行业,是不是收到的冲击就会小很多、个别甚至受益于此呢?美国股票在三月份一泻千里的时候,大家确实感慨经济危机到来了,然而现在一飞冲天又怎么说呢?

从美国GDP和失业率的数字来看,美国现在已经是处于经济衰退了。NBER早些时间正式宣布了2020年2月是上一个增长阶段的顶峰,现在开始进入衰退。他们网站上这张表还是蛮有意思的,摘抄过来,顺便标注一下我有记忆的一些事件:

(如果表格不能正常显示,请点进全文。我的网站css可能有些问题,暂时没时间修...)

Turning Point DatePeak or TroughAnnouncement Date with Link
February 2020
新冠病毒
PeakJune 8, 2020
June 2009TroughSeptember 20, 2010
December 2007
次贷危机
PeakDecember 1, 2008
November 2001TroughJuly 17, 2003
March 2001
互联网泡沫
PeakNovember 26, 2001
March 1991TroughDecember 22, 1992
July 1990PeakApril 25, 1991
November 1982TroughJuly 8, 1983
July 1981PeakJanuary 6, 1982
July 1980TroughJuly 8, 1981
January 1980PeakJune 3, 1980

既然经济衰退已经是事实,那么我们会有一些什么样的预期呢?很多人一说到经济危机,条件反射就是那张大衰退时期牛奶被白白倒掉的照片。时至今日,显然倒牛奶给我们的视觉冲击依旧,而个人却可能有更切身的体会。比如,今年毕业找工作的,或者原计划来美国留学的。随着一波又一波的裁员和招聘收紧,面临人生重大“跳跃”的人群突然不知道能不能顺利地到达彼岸了。

关于这群人的命运,Oreopoulos, P., Von Wachter, T., & Heisz, A. (2006)的这篇论文可以给出一些答案。总体而言,应届生被迫一开始接受不甚理想的工作(更低一些的工资 -9%、加入规模小一些的企业等),虽然这些差别会在十年之后慢慢消退。而且可以预见的,能力更强的学生(即拥更高人力资本)受到的冲击会小于相对能力较弱的学生。JG Altonji, LB Kahn, JD Speer (2016)也佐证了-10%这个冲击幅度。Liu, KG Salvanes, EØ Sørensen (2016)也观察到失业率每上升一个百分点,初始收入则下降6个百分点(挪威的数据)。

此外,如果我们针对特定的行业(比如学术界,一般来说学术界的职业发展路径相对直接),长期的影响可能会更明显。P Oyer (2006)研究了经济学界的大小年现象,在这个初始教职很大程度上决定了整个发展路径的行业。他发现若是初始工作的机构排名高,那么3-15年后工作的机构排名也会高0.6。如果一开始在前50的机构工作,那么他们会有60%更高的概率依旧在前50工作。而经济危机会冲击到教职市场的供需平衡,导致应届毕业生找到的教职更差。P Oyer (2008) 的另一篇文章则在华尔街找到了类似的答案:股票市场好的时候,MBA应届生更可能直接去华尔街工作,而后续更可能呆在华尔街并赚更多的钱(差别有1.5-5百万美金这样)。

P Oyer (2006) 里面提出了一个很有意思的观点:如果一个经济学家足够聪明,那么他应该试图规划每次换工作的时间,争取在大年内找到更好的工作。可能对于学术圈来说,推迟毕业时间等等都可以达到如此的效果。这样的策略是不是也能应用到其他行业呢?Marginal Revolution在2009年有一篇很有意思的讨论——人们在经济衰退的时候是不是应该重返校园?每个人的观点都不同,不过听起来重新读书并不一定可以帮助人们完全跳过经济衰退的负面影响。人生有时逃不过一命二运三风水,想改变环境的约束并不是那么容易。

说完了找工作,那再说一下收入不均的问题。最近很多人在贴美国收入不均等的数据。确实,从二战结束之后到现在,美国的财富分布不是更均衡了,而是更集中在少数人群手里了。这背后有很多制度的原因,而经济危机成为了推波助澜的帮凶。每一次经济危机之后,最先恢复的都是富裕阶层,而中产阶级则更有可能跌入贫困阶层。Saez (2016) 的数据显示,最富有的1%群体在次贷危机之后的财富增长速度是剩余99%的人的两倍。此外,NTY也有报道,直到2016年,只有最富裕的10%恢复到了次贷危机前的财富水平,其他90%尚有所缩水。各种原因其实也不难解释。财富越多,就越有可能依赖资本性收入而不是劳动收入(即工资)。而一旦进入贫富状况需要借钱生存,那资金流动性的约束就越可能更强。比如在美国,很多人住房租日付的酒店而不是月付的公寓,就是因为无法一次性拿出一个月的租金,而其收入本身可能就是日结的(例如uber司机)。这样一来,其住宿成本无法降低,反而更加剧了流动性约束的陷阱。这只是一个例子,流动性的约束无所不在,只是不同程度罢了。经济危机对流动性的冲击,可能对于个人是毁灭性的。

暂时就想到这两个主要的关于经济衰退的议题。后面若是想到更多,会再加以补充吧。最近不知不觉看了这么多Saez的文章,感觉是不是可以溜过去旁听一些他的课呢...

Categories
事儿关经济

中国地名的字频统计(县级及以上)

前几天看到微博上大家讨论县城名字:http://weibo.com/1444865141/EjcmoaykB

screen-shot-2016-11-27-at-5-44-05-pm

一时好奇,就把官方数据拿来看了一下。(2016年9月中华人民共和国县以上行政区划代码)

全部用来命名的只有1228个字,而相较于新华字典一般收录的八千到1万字,覆盖面其实挺小的。

不出意外的,这个字频分布呈现快速下降的长尾分布。看一下这个数据,还是蛮有意思的。

  • 第一名的“族”主要是有各种少数民族自治行政区划的存在。
  • 如果不看这个,则最受大家喜欢的就是“山”,“城”,“阳”,“江”,“安”,“州”。
  • 四个方向中,排序为“南”>“东”>“西”>“北”。
  • 地势描述成为了命名的主力词:山、江、河、海、川、湖、溪、林等。
  • 五行排名如下:水>金>土>木,然后没有火!看来全国人民都痛恨火灾。是不是和马伯庸提到的“雪”同理?大家都讨厌灾害。

这里贴一下前50高频词。

char_freq

完整的字频统计在这里: 中国县级及以上行政单位字频统计.txt

然后我们分区域来看一下各个区域特征。因为港澳台地区没有太多数据,所以我们只分析六大区域:华北、东北、华东、华中/华南、西南、西北。

  • 地势:除了西北地区以外,其他五个地区特别喜欢“山”。此外,东北常用“江河岭”,华北、西北常用“河”,华中/华南常用“江”,华东常用“江湖”,西南常用“江川”。
  • 四个方向:东北地区喜欢“东西”,华北地区喜欢“西”,华东地区喜欢“东南”,华中/华南常用“南”,西北常用“西”,西南常用“西南”。
  • 东北地区、西北地区、华南地区多有少数民族,故而地名含有民族名称。

region

全部数据下载:

中国县级及以上行政单位字频统计(按省份).txt

中国县级及以上行政单位字频统计(按地区划分).txt

原始数据:

town_name.csv

分析脚本:

town_name <- read_csv("~/Documents/town_name.csv")
names(town_name) = c("code","name")

town_name$name_s = gsub("市$|区$|县$|旗$|自治.*?$|盟$|省$","",town_name$name)
unique_character = unlist(strsplit(town_name$name_s,split = ""))
character_freq = as.data.frame(table(unique_character))
library(dplyr)
character_freq = character_freq %>% 
  arrange(Freq) %>% 
  mutate(rank = 1:nrow(character_freq))
write.csv(character_freq, file = "character_freq.csv", row.names = F)

library(ggplot2)
top_50 = character_freq %>% filter(Freq >= 25) 
ggplot(top_50, aes(x = as.factor(rank), y = Freq)) + 
  geom_bar(stat="identity", alpha = 0.5, fill = "grey")+
  coord_flip()+
  theme_bw(base_family = "Hei") +
  scale_x_discrete(labels = top_50$unique_character) +
  xlab("") +
  geom_text(aes(label = Freq, y =Freq/2 ), color = "deepskyblue3") +
  ylab("频次")+ggtitle("中国县级及以上行政单位字频统计")

#五行
character_freq %>% filter(unique_character %in% c("金","木","水","火","土")) 

#省

town_name$province = substr(town_name$code, 1,2)
town_name$region = substr(town_name$code, 1,1)

unique_prov =  town_name %>%  
  filter(grepl("0000",town_name$code))

char_by_prov = lapply(unique_prov$province, function(x) {
  prov = subset(town_name,province==x)
  chars = unlist(strsplit(prov$name_s,split = ""))
  freq_prov = as.data.frame(table(chars))
  freq_prov$rank = rank(-freq_prov$Freq, ties.method = "first")
  freq_prov$prov = x
  return(freq_prov)
})
char_by_prov = do.call(rbind, char_by_prov)

names(char_by_prov)
ggplot(char_by_prov %>% filter(rank<=5 & chars != "族" & ! prov %in% c(82,81)), aes(x= rank, y = Freq)) +
  geom_bar(stat="identity", alpha = 0.3)+
  facet_grid(name~.)+
  theme_bw(base_family = "Hei") +
  geom_text(aes(label = chars, y = Freq/2),family = "Hei")+
  coord_flip()+
  xlab("") +
  ylab("字频")
write.csv(char_by_prov, file = "char_by_prov.csv", row.names=F)

#by region
char_by_region = lapply(1:6, function(x) {
  prov = subset(town_name,region==x)
  chars = unlist(strsplit(prov$name_s,split = ""))
  freq_prov = as.data.frame(table(chars))
  freq_prov$rank = rank(-freq_prov$Freq, ties.method = "last")
  freq_prov$region = x
  return(freq_prov)
})
char_by_region = do.call(rbind, char_by_region)
char_by_region$region = factor(char_by_region$region)
levels(char_by_region$region)  = c("华北","东北","华东","华中/华南","西南","西北")

ggplot(char_by_region %>% filter(rank<=10 ), aes(x= rank, y = Freq)) +
  geom_bar(stat="identity", alpha = 0.3)+
  facet_grid(region~.)+
  theme_bw(base_family = "Hei") +
  geom_text(aes(label = chars, y = Freq/2),family = "Hei")+
  coord_flip()+
  xlab("") +
  ylab("字频") + ggtitle("中国县级以上行政单位字频统计(按区域划分)")

write.csv(char_by_region %>% filter(rank<=10 ), file = "freq_by_region.csv",row.names = F)
write.csv(char_by_region, file = "char_by_region.csv", row.names = F)
# draw regional map

library(ggmap)  


# find each regional center
unique_region = filter(unique_prov, substr(province,2,2)==2 & region<=6)   
location = lapply(unique_region$name,geocode)
location = do.call(rbind,location)
unique_region = cbind(unique_region,location)
unique_region$region = factor(unique_region$region)
levels(unique_region$region)  = c("华北","东北","华东","华中/华南","西南","西北")

# top 10 char for each region
top_10_region = char_by_region %>% filter(rank<=10 )
top_10_region =  top_10_region %>% 
  mutate(labels = paste0(chars," (",Freq,"次)"))

top_10_region = merge(top_10_region,unique_region, by ="region")
#adjust label positions

top_10_region_g = top_10_region %>% 
  mutate(lon_a = lon - rank %%2 *5 -3,
         lat_a = lat  - rank/2 - rank %%2 *(1/2)+5/2) %>% 
  select(c(region, rank, lon_a, lat_a, labels)) %>% 
  arrange(region,rank)

#manual adjustment
top_10_region_g = top_10_region_g %>% mutate(
  lon_a = lon_a + (region == "华东")*(7) + (region == "西南")*(-3)
)

qmap('China',color="color", zoom = 4, maptype = "satellite", alpha = 0.8) + 
  geom_text(data = top_10_region_g, aes( x = lon_a, y = lat_a, label = labels),
            family = "Hei",color = "white") +
  geom_text(data = unique_region,aes( x = lon-6+ (region == "华东")*(7)+ (region == "西南")*(-3), y = lat+3, label = paste0(region,"地区:")),
            family = "Hei",color = "white")
  

 

Categories
事儿关经济

AEA的一点记录

年初的时候连续三天跑到三藩AEA去凑了个热闹。如果这次不是在三藩的话估计我也不会大老远特意跑过去,毕竟这个会都是学术界的人,我跑过去难免有纯粹凑热闹惹人烦之嫌。

首先就是被会议的规模惊呆了。作为一个见惯了国内各种大型会议各种大场面的人,我还是被这样上万人的会议惊呆了。谁说美国地广人稀来着....据某个童鞋说,她从欧洲飞过来入关的时候,SFO的海关都知道了,直接问,“是那个经济学会议对吧?”。这两天的飞机上各种都是来开会的人也不足为奇,据说有好多邻座什么的都是economists或者未来的economists...很多人的直接反馈就是这样的job market确实是很有效率的,是一个高效的matching algorithm,只是不是机器计算的而是大家各种人肉计算出来的。

从上段的描述可以看出来,很多人来AEA就是来找工作的,要么来面试要么面试其他人。像我这种纯粹去围观的估计不多——虽然有很多演讲的sessions但是大家基本也都是各种小圈子里面自娱自乐。说实话,虽然我已经毕业这么久了,但是我也没想到很多session已经到了看标题都看不懂的地步了...哎,分工实在是太细了。

对我来说最重要的估计就是见各种人了——见到了很多快五年没有见过的人。估计不是AEA的话,这些人真的是再过n多年都不一定能见到。有的时候也是感慨,很多在国内的人在国内的时候各种见不到,跑到美国来反而容易见到。各种在美国的人在美国的时候见不到,回国反而能见到。这是一种什么样的给航空公司创造利润的模式...还是用一种最好听的方式来表述吧:大家越来越国际化了。

大牛的话,我主要是去围观Susan Athey的,连听了她两场。一场是比较好玩的bitcoin,都是一些描述性的统计,但是问题本身很好玩,很多新的东西大家都不知道是怎么回事儿,看到一些基本的分析、想想后面的逻辑也是蛮有意思的。另一场是big data,就是她们的tree model去detect heterogeneous treatment effect,这东西前段时间一直在跟,所以到也不陌生,只是感慨很多想法大家其实都有,最后就是看谁有数据谁又坚持下去一点一点把细节都推敲出来。话说中途发消息给某统计学家感慨,人家直接懒懒的回我一句,不记得了。好吧,大牛们的脑路变化都是奇快无比的,不记得就不记得吧。作为一个乖乖的学生,我自己记得学习的心路历程就好了。还去听了Tadelis的两场,虽然很多paper已经听过一遍了,但是去现场玩玩还是挺好玩的,顺便可以见到很多ebay和ex-ebay的人(其中有真人比照片帅的帅哥)。也是一种networking的过程吧。

还有比较好玩的就是不同人的不同状态。很多找工作的人在三天的时间有十几个面试,于是各种亚历山大、繁忙的穿梭在各个酒店之间,偶尔路上碰到也就是匆匆打个招呼。已经进入tenure clock的人相对来讲这次就是来聚一聚的,席间还能听到各种八卦。打算明年上job market的就是提前来看一下情况顺便听听sessions,倒也蛮紧凑的。相比来讲心态最放松的大概就是已经拿到tenure的,来开会更多是纯粹的来开会。各种人的各种状态和各种消息还是蛮有意思的。

还有什么呢?好像已经习惯了每天往返三藩和圣何塞,这样的折腾背后也是预示着什么——既然有那么多事情都是在三藩。

Categories
事儿关经济 读书有感

同桌的你

还有一篇也挺好玩的,想起了同桌的你?基本就是说,跟异性混的多的话数理成绩会下降哦。哎,说好的什么“绿衣捧砚催题卷,红袖添香伴读书”呢?

The Girl Next Door: The Effect of Opposite Gender
American Economic Journal: Applied Economics Vol. 7, Issue 3 -- July 2015
Parents are concerned about the in influence of friends during adolescence. Using the gender composition of schoolmates in an individual's close neighborhood as an instrument for the gender composition of an individual's self-reported friendship network, this paper finds that the share of opposite gender friends has a sizable negative effect on high school GPA. The effect is found across all subjects for students over the age of sixteen, but is limited to mathematics and science for younger students. Self-reported difficulties getting along with the teacher and paying attention in class are important mechanisms through which the effect operates.