Por qué es importante
Si alguna vez has unido datos demográficos del Censo con datos de empleo de BLS con Renta Justa de Mercado de HUD, has usado un código FIPS. Es el identificador estándar federal para estados (2 dígitos) y condados (3 dígitos, combinados en un código de estado+condado de 5 dígitos). Cada conjunto de datos federal indexa sus filas a nivel de condado por FIPS. Por qué importa a los inversionistas: los límites de CBSA cambian entre las añadas de OMB, pero los códigos FIPS de los condados son estables. Cuando agregas datos federales al nivel de CBSA, te unes a través del FIPS de condado — no a través de cadenas MSA provistas por el proveedor que pueden o no coincidir.
De un vistazo
- Qué es: El identificador numérico federal de 5 dígitos para cada condado de EE.UU. — 2 dígitos de estado + 3 dígitos de código de condado.
- Por qué importa: Cada conjunto de datos federal usa FIPS como la clave canónica de condado. Es la columna de unión que hace combinables los datos de Censo + BLS + BEA + HUD + FHFA.
- Cómo usarlo: Al agregar a nivel de CBSA, únete a través de `geo.county.fips` al código CBSA. Al consultar un solo condado, usa el código FIPS, no el nombre del condado (los nombres de condado colisionan — hay más de 30 "Washington Counties").
- Formato: `SSCCC` donde SS = FIPS de estado (01-78) y CCC = FIPS de condado (001-840).
- Gobernanza: Originalmente un estándar NIST (FIPS 6-4 para condados). Formalmente reemplazado por los códigos "GNIS" de ANSI/Census en 2008, pero el formato de 5 dígitos es idéntico y el término "código FIPS" sigue siendo el uso estándar de la industria.
Cómo funciona
Qué es realmente FIPS. FIPS significa Federal Information Processing Standards — una familia de códigos que el gobierno de EE.UU. desarrolló a partir de los años 1960 para estandarizar cómo las agencias federales intercambian datos. Para los inversionistas inmobiliarios, el que importa es FIPS 6-4, el estándar de código de condado. Asigna un número de 2 dígitos a cada estado (Alabama = 01, California = 06, Ohio = 39, Texas = 48) y un número de 3 dígitos a cada condado dentro del estado (Franklin County OH = 049, Harris County TX = 201). El código combinado "estado+condado FIPS" de 5 dígitos identifica de manera única cada condado del país: Franklin County Ohio es 39049, Harris County Texas es 48201. Cada agencia federal usa estos códigos. El estándar fue publicado originalmente por la Oficina Nacional de Estándares (ahora NIST); la publicación formal FIPS 6-4 todavía se referencia aunque FIPS fue formalmente superado por los códigos ANSI/Census en 2008. El formato de 5 dígitos y la mayoría de los valores de código son idénticos, así que "código FIPS" sigue siendo el uso común en la industria.
Por qué FIPS importa más que el nombre del condado. Los nombres de condado colisionan. Hay más de 30 "Washington Counties" en EE.UU. Hay más de 15 "Jefferson Counties." Hay 9 "Franklin Counties." Si consultas un conjunto de datos con filas etiquetadas solo por nombre de condado, unirlo a otro conjunto de datos requiere reconciliar cuál "Washington County" quieres decir. Los códigos FIPS eliminan la ambigüedad: Washington County PA es 42125, Washington County OR es 41067, Washington County MD es 24043. La lista de códigos ANSI de la Oficina del Censo es la referencia canónica para el conjunto completo de códigos. Para los inversionistas que usan múltiples fuentes de datos federales — FHFA HPI unido con la Renta Justa de Mercado de HUD unida con permisos de construcción del Censo unidos con ingreso personal de BEA — FIPS es cómo funciona cualquier análisis.
FIPS vs CBSA — político vs económico. Los códigos FIPS identifican unidades políticas: estados, condados. Las CBSAs identifican unidades económicas: grupos de condados que comparten un mercado laboral. Para una pregunta específica de bienes raíces, a menudo necesitas ambos. "¿Qué está pasando en la economía del área metropolitana de Columbus?" es una pregunta de CBSA (CBSA 18140). "¿Qué condados están en el área metropolitana de Columbus?" se responde por la definición de CBSA — Columbus MSA 18140 incluye 8 condados, cada uno con su propio código FIPS. Para unir datos federales a nivel de condado (digamos, empleo mensual de BLS) al nivel del área metropolitana, tú: (1) extraes los datos al grano de FIPS de condado, (2) buscas a qué CBSA se mapea cada FIPS, (3) agregas. El mapeo de FIPS → CBSA se publica por OMB como parte de cada delineación CBSA. Cambia cuando OMB actualiza las definiciones CBSA, pero los códigos FIPS en sí no cambian — el mapeo sí. Por eso usar FIPS como la clave de unión estable es esencial para el análisis multi-anual.
Dónde aparece FIPS en los flujos de trabajo de inversionistas. Cada pipeline serio de datos federales indexa las tablas a nivel de condado por FIPS. FRED incluye FIPS como identificador de serie para las series a nivel de condado de empleo de BLS e ingreso personal de BEA. Nuestro propio pipeline indexa las tablas de condado por una columna `fips`, y las une hasta CBSA a través de una tabla de mapeo. Los límites de ingreso de Sección 8 de HUD se publican por FIPS. Los datos de migración del IRS que alimentan el análisis de precios de vivienda usan FIPS como la clave de origen/destino. Si estás construyendo cualquier tipo de análisis multi-fuente, FIPS es el identificador con el que estandarizas. Si la fuente de la que estás comprando no incluye códigos FIPS, pídelos — o prepárate para hacer una unión difusa basada en nombres, que es cómo ocurren los errores de datos.
Ejemplo práctico
Carmen Vargas intenta combinar tres conjuntos de datos federales y descubre por qué existe FIPS.
Carmen está construyendo una hoja de cálculo de análisis para 3 condados en Ohio. Descarga:
- BLS LAUS: desempleo mensual por nombre de condado, abreviatura de estado
- Censo ACS: ingreso familiar mediano por nombre de condado, nombre de estado
- BEA Regional: ingreso personal per cápita por FIPS de condado
Los primeros dos conjuntos de datos tienen filas "Franklin County". Necesita averiguar a cuál Franklin County cada uno se refiere — Ohio tiene uno, pero también lo tienen otros 8 estados. Franklin County de Kentucky, Franklin County de Indiana, Franklin County de Virginia... todos también aparecerían en un conjunto de datos etiquetado solo "Franklin County."
Podría filtrar por columna de estado, pero luego nota que BLS usa "OH" mientras que el Censo usa "Ohio" — una unión basada en coincidencia de cadenas fallaría a menos que normalizara.
Luego consulta el conjunto de datos BEA, que tiene una columna FIPS. 39049. Añade una columna FIPS a las filas BLS y Censo usando una tabla de búsqueda indexada a (estado + nombre de condado). Ahora los tres conjuntos de datos comparten la misma clave. La unión funciona.
La hoja de cálculo de análisis que construye escala: puede añadir un cuarto conjunto de datos (FMR de HUD), un quinto (HPI de FHFA), un sexto (migración del IRS) — todos ellos indexados por FIPS. Si hubiera empezado con nombres de condado basados en cadenas, cada nuevo conjunto de datos habría requerido una pasada de reconciliación personalizada.
Pros y contras
- Cada conjunto de datos federal usa FIPS como el identificador canónico de condado — una clave hace todo combinable
- Los códigos de 5 dígitos eliminan la ambigüedad que los nombres de condado introducen (más de 30 "Washington Counties" a nivel nacional)
- Los códigos FIPS son estables en el tiempo — los condados no se renumeran cuando las CBSAs sí lo hacen
- La Oficina del Censo publica una lista de códigos ANSI gratuita y canónica que es la única fuente de verdad
- FIPS es la lingua franca de los sistemas estadísticos federales — todos, desde el Censo hasta BLS hasta FRED, lo hablan
- Los proveedores de datos comerciales no siempre incluyen códigos FIPS, así que a veces tienes que añadirlos tú mismo a través de una tabla de búsqueda
- El FIPS de estado de 2 dígitos va del 01-78 pero no de manera contigua (salta algunos números por razones históricas); no puedes inferir simplemente "estado 39 = 39º estado alfabéticamente"
- Los códigos FIPS han sido formalmente reemplazados por los códigos ANSI/Census desde 2008, lo que crea confusión ocasional en la documentación — pero el formato y los valores son idénticos
- Algunos conjuntos de datos usan FIPS de 5 dígitos como cadena y quitan los ceros iniciales ("39049" vs "39049" vs "1011"), lo que rompe las uniones de cadena cuando los archivos se guardan como numéricos
- Puerto Rico, Guam y los condados territoriales tienen sus propios códigos FIPS que algunas herramientas no manejan correctamente
Ten en cuenta
- Pérdida de ceros iniciales: Cuando guardas un código FIPS en CSV y lo reabres en Excel, "01011" (Autauga County AL) se convierte en "1011" porque Excel quita los ceros iniciales en columnas numéricas. Siempre guarda FIPS como texto o rellénalo de nuevo a 5 dígitos al cargar.
- FIPS vs ANSI: NIST retiró formalmente FIPS 6-4 en 2008 a favor de los códigos ANSI mantenidos por el Censo. Los valores y formato son idénticos; solo cambió la gobernanza. "FIPS" sigue siendo el término de la industria.
- El código de estado no es secuencial: Los códigos FIPS de estado se asignan históricamente (Alaska = 02 porque fue el 49º estado admitido, California = 06 porque fue el 31º — la numeración refleja asignaciones de territorio pre-estadidad, no orden alfabético). No puedes inferir nada del número.
- Los cambios históricos de condado importan: Algunos condados han sido renombrados o fusionados (por ejemplo, Shannon County SD se convirtió en Oglala Lakota County SD en 2015 con un nuevo código FIPS 46102 reemplazando 46113). Los datos históricos unidos por FIPS necesitan manejo consciente de añada.
- FIPS territoriales: Los condados de Puerto Rico usan el código de estado 72, Guam usa 66, Islas Vírgenes 78. Algunas herramientas los filtran silenciosamente pensando que son inválidos. Si tu análisis cubre PR, confirma que tu cadena de herramientas lo maneje.
Preguntas frecuentes
Conclusión
Los códigos FIPS son la clave de unión federal para cualquier cosa a nivel de condado. Si estás construyendo un análisis de bienes raíces multi-fuente, estandariza a FIPS temprano y únete a todo a través de él. El código sobrevive los cambios de añada de OMB, elimina la ambigüedad de nombre de condado, y es publicado gratis por el Censo. Cualquier otro enfoque de unión — por nombre de condado, por abreviatura de estado, por ID específico del proveedor — eventualmente te morderá.
