Warum überträgt die US-Volkszählung absichtlich die Bevölkerung in benachbarte Volkszählungsblöcke?

Ich bin ein wenig an der Neuordnung des Vermont House und des Burlington City Council beteiligt.

Mir ist bei mindestens zwei Zensusblöcken aufgefallen, dass die Volkszählung deutlich über der Meldepopulation liegt. Beide sind mit District Builder auf dieser Karte von Burlington, Vermont, sichtbar .

Ein Zensusblock ist Block #16005, der Teil der University of Vermont „Green“ ist . Absolut keine Gebäude, Wohngebäude oder andere, und die Volkszählung meldet 20 Personen.

Geben Sie hier die Bildbeschreibung ein

Der andere ist Block Nr. 4460, das Ethan Allen Homestead mit einem Hausmeister (und vielleicht einem Ehepartner oder Partner), der auf dem Grundstück lebt. Doch die Volkszählung meldet es als 12 Personen. Ich weiß mit Sicherheit, dass es falsch ist.

Geben Sie hier die Bildbeschreibung ein

Ich nehme an, sie übertragen Zählungen aus benachbarten Blöcken, so dass die Gesamtzählungen für Städte, Landkreise und Bundesstaaten immer noch korrekt sind. Ich kann mir vorstellen, dass sie versuchen, einige private Informationen zu schützen, indem sie diese Zahlen verzerren. Aber ist das der Grund, warum sie es tun? Ich verstehe wirklich nicht ganz, warum sie das tun.

Ist so etwas in seiner Umgebung noch jemandem aufgefallen? Kennt jemand den dünnen drauf?

Es gibt andere wirklich alberne Blöcke, die sie herausgearbeitet haben, aber diese Frage kann später warten.

Ich mache Volkszählungsarbeit für die Kommunalverwaltung. Die dummen Formen sind genau wie die Volkszählung die Gebiete aufteilt, es sind alle Straßenmittellinien, Verwaltungsgrenzen, geografischen Grenzen (Flüsse), die alle miteinander kombiniert und dann als Blockgrenze verwendet werden, was zu winzigen Gebieten oder Gebieten ohne Menschen führt. Es ist sehr unwahrscheinlich, dass ein Haushalt eine dieser Grenzen überschreitet, obwohl ich mir eine Ausnahme in meiner eigenen Stadt vorstellen kann.
Oh nein, @RomaH , ich habe mich noch nicht einmal mit den albernen Formen befasst. Oben auf dem UVM Redstone Campus gibt es einige extrem alberne Formen. Und es gibt alle möglichen kleinen Bezirke mit Null Einwohnern, die einem Zählblock zugeordnet sind.
Danke, @eps. Es scheint ziemlich relevant zu sein.

Antworten (1)

Das Census Bureau praktiziert Offenlegungsvermeidung , um, wie Sie vermuten, die Privatsphäre einzelner Auskunftspersonen zu schützen. Das Census Bureau möchte sicherstellen, dass ein Verbraucher der von ihm produzierten Daten die von ihm veröffentlichten Daten nicht de-anonymisieren kann. Sie verwenden eine Vielzahl von Techniken, um dies zu erreichen, einschließlich Datenaustausch und Rauschinjektion, die vermutlich beide für die von Ihnen beobachteten Probleme verantwortlich sein könnten.

Die verlinkte Seite zur Vermeidung von Offenlegungen enthält eine Reihe von Artikeln und anderen Ressourcen, die viel detaillierter auf die verschiedenen Techniken eingehen, die verwendet werden, wenn Sie mehr ins Detail gehen möchten.

Dies erklärt nicht, warum sie Lärm in einen Block mit null Einwohnern einspeisen würden, es sei denn, das Fehlen von Gebäuden impliziert keine null Einwohner (dh es kann Obdachlosenlager geben) oder Sie schlagen vor, was als Fehler angesehen werden könnte die Anwendung von Lärm.
@TechInquisitor - Wenn Sie Rauschen einspeisen oder Daten austauschen, müssen die aggregierten Ergebnisse korrekt bleiben. Es ist also durchaus möglich, dass sie 20 Personen aus einem benachbarten Block entfernt haben und sie zufällig in dem freien Block erschienen sind (ich weiß nicht, dass sie spezielle Regeln für den Umgang mit völlig leeren Blöcken haben). Es könnte natürlich sein, dass dort Obdachlose waren oder dass jemand ihre Adresse falsch eingegeben hat und die Mapping-Software sie in den leerstehenden Block eingeordnet hat.
Es gibt öffentlich zugängliche Papiere , die die Methodik und mehr beschreiben, wenn Sie weiter graben, @TechInquisitor Sie sollten nicht genau erklären können, warum sich dort 20 Bewohner in einem bestimmten Block befinden, da die Geräuschinjektion zufällig und mehr oder weniger unerklärt sein sollte ansonsten ist es keine sehr gute Verschleierung. ABER die aggregierten Daten sollten immer noch korrekt, nützlich und mit einem bekannten Rausch- oder Fehlerpegel sein.
@TechInquisitor Die Obdachlosenlager sind absolut ein guter Grund, dies zu tun: Andernfalls könnten Volkszählungsdaten verwendet werden, um illegal zeltende Obdachlose aufzuspüren, indem nur diejenigen mit > 0 Einwohnern betrachtet werden!
20 Personen in einen leeren Block zu stecken, hätte keinen Wert, um Daten zu verbergen. Daher würde ich vermuten, dass es sich um Obdachlose handelt.
@LorenPechtel Wie Joe vorgeschlagen hat, verbirgt eine allgemeine Praxis, sowohl leere als auch fast leere Blöcke zu melden, als ob sie eine kleine Anzahl von Menschen hätten, welche dieser Blöcke wirklich leer sind und welche nur fast leer sind. Wenn Sie Parks melden, in denen niemand als Null lebte und in denen jemand als 20 lebte, dann lecken die Daten genau, in welchen Parks Obdachlose leben.
@LorenPechtel, ich kann absolut garantieren, dass es im UVM Green keine Obdachlosenlager gibt . Es macht für mich keinen Sinn, dass die Volkszählung versucht, uns zu sagen, dass dort 20 Menschen leben.
@robertbristow-johnson: Irgendwie würde das Markieren, welche leeren Blöcke sicher als leer gemeldet werden können, umfassende Kenntnisse der Blöcke erfordern, wäre wahrscheinlich politisch angespannt und würde den Zweck vollständig zunichte machen. In jedem Block, der nicht als "sicher" gekennzeichnet ist, könnte angenommen werden, dass Menschen darin leben; weiter: In jedem Block, der von der "sicheren" Liste entfernt wird, leben sicherlich Menschen. In beiden Fällen steht das größere Interesse des Census an der Anonymisierung von Daten der Existenz einer solchen Liste entgegen. Also: Der Schutz der Privatsphäre verlangt von der Volkszählung, dass das UVM Green etwa 20 Einwohner hat.
@robertbristow-johnson, die Volkszählung versucht nicht, Ihnen zu sagen, dass 20 Menschen auf UVM Green leben. Es versucht Ihnen mitzuteilen, dass auf UVM Green null oder mehr Menschen leben und dass die tatsächliche Anzahl innerhalb der für diesen Block zulässigen Fehlergrenze liegt.
Entschuldigung @ChristopherHarwood, ich bin von dieser Erklärung absolut nicht überzeugt. Wenn wir Distrikten oder Bezirken Blöcke mit District Builder zuweisen, weisen wir 20 Personen einem Bezirk zu und unsere Bezirke müssen innerhalb von 10 % voneinander entfernt sein, damit wir nicht riskieren, dass uns ein Richter niederschlägt. Ich denke, dass die „Offenlegungsvermeidung“ stärker durchdacht werden muss.
@robertbristow-johnson Es wurde viel darüber nachgedacht – dies ist eine sehr aktive Debatte für statistische Ämter auf der ganzen Welt, die Daten dieser Art veröffentlichen. Leider gibt es keine perfekte Lösung – es müssen Kompromisse zwischen Datenqualität, Rechenschwierigkeiten (einige Methoden erfordern die Lösung schwieriger Optimierungsprobleme) und der Gewährleistung eines gewissen Grades an Vertraulichkeitsschutz eingegangen werden. 1/2
@robertbristow-johnson Eine weitere Überlegung ist, dass Daten in diesem feinen Detail auch ohne Offenlegungskontrolle unzuverlässig sind. Wenn jemand auf die Volkszählung nicht reagiert oder ein neues Wohnhaus auf einem zuvor leeren Land gebaut wird, können die Zählungen für 2020 ein paar Jahre später stark abweichen. Lokales Wissen kann helfen, das abzumildern, aber es wird sehr arbeitsintensiv, wenn Sie dies in großen Mengen tun. 2/2
@GeoffreyBrent, "garantiere ein gewisses Maß an Vertraulichkeitsschutz", aber wenn eine aufgezählte Person 72 Jahre alt wird, verwirft das Census Bureau (und das National Archives) diesen "Vertraulichkeitsschutz". Sieht so aus, als hätte der Schutz ein Ablaufdatum.
@BobE Ich denke nicht, dass das ganz richtig ist. Ich bin nicht in den USA, aber meines Wissens hält die US-Volkszählung personenbezogene Daten 72 Jahre lang nach der Erhebung vertraulich, nicht bis das Subjekt 72 Jahre alt ist. Die frühestmögliche Veröffentlichung von PII über eine Person wäre also, wenn sie 72 Jahre alt wird – aber das würde nur die Veröffentlichung von Daten ermöglichen, die gesammelt wurden, als sie null Jahre alt waren. Die letzten 72 Jahre ihres Lebens wären immer noch geschützt... 1/2
@BobE Viele Länder haben ähnliche Bestimmungen, die die Freigabe von PII lange nach der Erfassung ermöglichen. Der Grund dafür ist, dass es nach vielen Jahrzehnten weniger wahrscheinlich ist, dass es immer noch sensibel ist, und es ist für Historiker wertvoll, da es Informationen enthält, die seit Menschengedenken nicht mehr existieren. Verschiedene Orte haben unterschiedliche Regeln, wie lange die Frist ist und ob eine Zustimmung erforderlich ist. Statistische Arbeit erfordert sehr oft, einen Mittelweg zwischen der Maximierung der Nutzung von Informationen und dem Schutz der Privatsphäre zu finden.
Wo ich 1950 lebte, die Namen meiner Eltern, die Namen meiner Geschwister, alle Informationen in der Volkszählung von 1950 wurden in den letzten 72 Jahren als "geschützt" betrachtet. Im April 2022 ist diese PPI jedoch nicht mehr geschützt. Liegt es daran, dass ich über 72 Jahre alt bin, dass mein PPI der Öffentlichkeit zugänglich wird? (Wurde von mir erwartet, dass ich sterbe?) Ich weise lediglich auf die Widersprüchlichkeit in den USA hin. Was die statistische Arbeit betrifft, so habe ich ernsthafte Bedenken hinsichtlich der Nützlichkeit meines Namens und der Namen meiner Familienmitglieder ---- vor 72 Jahren.