为什么重要
每一项按"邮编"层级发布的联邦人口资料,其实都是按ZCTA索引,而不是按USPS邮编。这个区别很关键:USPS邮编是投递路线,不是多边形——在法律或地理意义上,邮编本身并没有"边界"。Census Bureau通过画多边形来近似每个邮编主要的投递范围,从而构造出ZCTA。约95%的邮编,ZCTA和USPS邮编差距小到可以忽略。剩下约5%的邮编(纯PO box邮编、大型商业邮编、部分乡村投递路线)会出现明显差异。如果你从Census ACS里拉某个邮编的人口资料,你实际拉到的是ZCTA的资料。清楚你的投资工具用的是哪种。
速览
- 它是什么: 由Census Bureau为统计发布而定义、对USPS邮编做多边形近似的地理单位。
- 为何重要: 联邦人口资料(Census ACS、IRS、HUD、USDA)都用ZCTA,而不是USPS邮编。两者大部分重叠,但约5%的邮编会出现偏差。
- 如何使用: 拉任何联邦邮编层级资料时,先确认来源是ZCTA(更常见)还是USPS邮编。对投资者分析而言,ZCTA的人口资料是标准。
- ZCTA总数(2020年Census): 约33,000个——每次十年期Census重新划定。
- 格式: 5位数字,与USPS邮编格式一致。
运作原理
ZCTA为何存在。 USPS邮编并不是真实的地理单位。它们是投递路线——邮递员跑的一串地址。一个邮编可能在郊区有个类似多边形的范围,同时还包括一条乡村路线去收散落的农村地址。它也可能完全只是个纯PO box邮编(没有任何物理区域)。因为邮编本身不是多边形,你没法直接对它计算人口统计。Census Bureau用ZCTA解决了这件事——邮政编码制表区,它们本身就是多边形。每个ZCTA通过把Census block(街区)分配给在这个block里拥有最多地址的那个邮编来构造。结果是:5位数字识别码通常与USPS邮编一致,外加一个支撑统计发布的真正多边形边界。
ZCTA vs USPS邮编——差异出现在哪里。 对多数住宅邮编,ZCTA与USPS邮编实际上是一回事。但有三类例外:(1)纯PO box邮编没有ZCTA,因为没有物理区域;(2)大型商业邮编(例如帝国大厦就拥有自己的邮编)没有ZCTA,因为里面没有居民;(3)乡村投递路线的ZCTA边界有时与实际投递范围对不上。实际后果:如果你从Census ACS拉ZCTA 10018(曼哈顿中城)的资料,你得到的是真实的人口数据。如果你拉一个纯PO box邮编,你什么都拿不到——资料干脆不存在,因为对应的ZCTA不存在。在投资者层面拉邮编级资料时,一定要先核对你关心的那个邮编是否有对应的ZCTA。
ZCTA vs FIPS——不同用途。 FIPS代码识别的是政治单位(县),边界稳定。ZCTA识别的是对邮编做的多边形统计近似,而邮编会随USPS新增/调整、并随每次十年期Census而变动。两者并存是因为它们回答不同的问题。县级分析用FIPS。邻里级分析用ZCTA(做人口资料)或USPS邮编(做房源资料)。把Census ACS的ZCTA资料与县级FHFA HPI连起来时,你要用Census发布的ZCTA-到-县的映射表,因为极少数情况下一个ZCTA会跨两个县,而一个县里通常含有多个ZCTA。主要的联邦资料集——Census ACS、HUD的SAFMR层级公平市场租金、IRS汇总资料、USDA乡村分类——全部都是以ZCTA粒度发布的。商业平台(Zillow、Redfin)通常用的是USPS邮编。
2020年Census的重绘。 ZCTA基于2020年Census资料做了全面重新划定,相对2010年ZCTA有些边界变动。如果你把2019年的ACS和2023年的ACS拿来比同一个"邮编",ZCTA边界对部分邮编已经发生了位移。多数邮编只是小幅变动(几个街区在相邻ZCTA之间移动),但对位于边界上的邮编,占地可能有明显改动。Census发布了一份ZCTA关系档,把2010年ZCTA映射到2020年ZCTA,可用于对齐历史资料。这一点主要对位于都会区边界上的邮编重要——某个在2010年完全位于CBSA 12345里的邮编,现在可能横跨了两个CBSA。
实战案例
林志豪(Lin Zhihao)拉他目标邮编的ACS人口资料,才发现那些数字其实是ZCTA数字。
林志豪正在评估位于邮编45202(辛辛那提市中心)的一栋三单元物业。他想要本地收入中位数、人口和教育结构,用于承销。他拉Census ACS。
他拿到的资料是ZCTA 45202。他去查Census的说明文件:ZCTA 45202涵盖USPS邮编45202约95%的地址。对他的用途而言没问题——人口、收入、教育的统计都能代表这个邻里。
他同时也从一家商业房源平台拉基于USPS邮编的租金资料。平台按USPS邮编45202报告。大多数房源落在ZCTA范围内,但有几处位于ACS资料没有覆盖的特定商用邮编。
实际影响:做人口资料,用ACS/ZCTA;要看某个街区的实际可租房源,用基于USPS邮编的商业资料。两者并用,清楚各自能回答什么问题。
如果他的目标物业恰好在一个纯PO box邮编(住宅里很少见,但在远郊会出现),ACS根本就不会返回资料——他得绕道用一个相邻的ZCTA来估。
优劣分析
- 做联邦邮编层级人口资料时,ZCTA是标准——Census ACS、IRS、HUD、USDA都在用
- 5位数字格式与USPS邮编一致,连接起来很直观(约95%的情况下)
- Census免费发布ZCTA的shapefile与关系档,便于历史资料对齐
- 对多数住宅邮编,ZCTA与USPS邮编的差距可忽略
- FRED以及其他联邦资料入口,把ZCTA索引的资料与县级资料一并发布
- 纯PO box邮编没有ZCTA——联邦资料对它们根本不存在
- 大型商业邮编(整栋大楼自己有邮编的那种)也没有ZCTA
- 每次十年期Census都会重新划定,给跨年份比较带来麻烦
- 商业不动产平台通常用USPS邮编,不是ZCTA,导致联邦与商业资料合并时出现小幅错配
- 极少数情况下,一个ZCTA会跨两个县,与县级资料合并时需要额外查映射档
注意事项
- 不是每个邮编都有ZCTA: 纯PO box邮编与商业大楼邮编都没有ZCTA。如果你的目标市场里有这类邮编,联邦人口资料就覆盖不到。
- ZCTA ≠ USPS邮编: 5位数字对得上,但地理覆盖范围可能有几个百分点的差异。多数住宅分析里不要紧;做边界分析时会影响结果。
- 2010 vs 2020 ZCTA: 历史ACS资料用的是2010年ZCTA;当前资料用2020年ZCTA。多数邮编边界变动不大,但边缘情况会有影响。
- ZCTA可能跨县: 极少但真实——位于县界上的ZCTA,居民可能分属两个不同的县。把ZCTA资料接到CBSA时,用Census的关系档,不要假设1对1映射。
- 商业平台不区分: Zillow、Redfin和多数CRE平台发布时只说"ZIP",并不指明是ZCTA还是USPS。把商业邮编资料与联邦ZCTA资料合起来时,预期会有小比例的边缘错配。
投资者问答
一句话总结
ZCTA是联邦对USPS邮编做的多边形近似,每一个严肃的联邦人口资料集都在用它。95%的情况下,它表现起来就和USPS邮编一样。剩下那5%——纯PO box邮编、商业大楼邮编、县界上的边缘情况——能救你一命的就是你知道这两者的区别,避免你去找其实并不存在的资料。记住:联邦资料 = ZCTA;商业平台 = USPS邮编;两者不一致时,做一次交叉核对。
