郵便番号はポリゴンではないという私のコメントの詳細...
郵便番号は、「ああ、私はに住んでいる」と言うので、エリア(ポリゴン)と考えることがよくあります。 このZIPコード...」は、包含領域の印象を与え、ZIPが「 Zone」の略であるという事実を示しています。 改善計画」は、ポリゴンとの誤った関連付けに役立ちます。
実際には、郵便番号は、ある意味で郵便配達ルートを表す線です。幾何学的には、線には面積がありません。 線が座標平面に沿った点の文字列であるのと同様に、郵便番号の線は配信点の文字列です。 USPS指定の住所の抽象的なスペースで。
ではありません 地理座標に関連付けられています。ただし、表示されるということがわかります。 キャリアが距離や場所に完全に関係のないルートを持つことは非効率的であるため、地理的に方向付けられる必要があります。
この「USPS指定住所の抽象的なスペース」とは何ですか?それが私が米国郵政公社によって維持されている配達可能な場所の大きくて神秘的なデータベースを説明している方法です。住所は地理に基づいて割り当てられるのではなく、通常は通りや移動性に関連する、運送業者が移動するルートに基づいて割り当てられます。
一部の5桁の郵便番号は、単一の建物、建物の複合体、または建物の1つのフロアです(はい、複数の郵便番号は、配達ポイントが垂直に階層化されているため、単一の座標に配置できます)。これらのいくつか(とりわけ)は「ユニークな」ZIPです。企業や大学は、マーケティングや組織の目的で独自の郵便番号を取得することがよくあります。たとえば、ZIPコード「12345」はニューヨーク州スケネクタディのゼネラルエレクトリックに属しています。 (編集:以前のバージョンのGoogleマップでは、そのリンクをたどると、座標ではない郵便番号を指しているため、配置マーカーがホバリングしていることに気付くでしょう。ほとんどの米国の郵便番号は以前は表示されていましたがGoogleマップ上の地域では、USPSがいわば「所有」しておらず、地域がないため、これらのタイプはできません。)
楽しみのために、一意の郵便番号で住所を確認してみましょう。 SmartyStreetsにアクセスして、12345の偽のアドレスを次のように入力します。
ストリート: 999 Sdf sdf
郵便番号: 12345
それを確認しようとすると、注意してください...それは有効です!なんで? USPSは、その固有の郵便番号のレセプタクルにピースを配信しますが、その時点で、それを配布するのはGEの責任です。住所(技術的には「配達ライン1」)を含め、郵便番号の内部にあるほとんどすべてのものはUSPSとは無関係です。多くの大学は同様の方法で機能します。これに関する詳細はこちらです。
次に、同じ偽の住所を郵便番号なしで試して、代わりに都市/州を実行します。
ストリート: 999 Sdf sdf
市: スケネクタディ
状態: NY
検証されません。これは、スケネクタディに住所が「有効」である12345が含まれていても、スケネクタディの「実際の」郵便番号と幾何学的に交差しているためです。
別の例を見てください:軍隊。特定の海軍艦艇には独自のZIPコードがあります。軍の住所は、同じ名前空間を使用するまったく異なるクラスの住所です。 。船が移動します。地理座標はそうではありません。
ZIPの精度も楽しいものです。 5桁の郵便番号は最も「正確」ではありません(ただし、郵便番号は何も特定しないため、ここでは「特定の」という用語の方が意味がある場合があります)。 7桁および9桁の郵便番号が最も具体的であり、多くの場合、都市部ではブロックレベルまたは近隣レベルにまで及びます。ただし、郵便番号はそれぞれサイズが異なるため、非常に困難です。 あなたが話している実際の距離を知るために。
9桁の郵便番号が建物の床に分割されている可能性があるため、数百の住所の可能性がある重複する郵便番号があります。
結論:郵便番号は、一般的な信念に反して、地理的データまたは境界データを提供しません。 それらは大きく異なり、郵便物や小包を配達しない限り実際にはまったく役に立ちません...しかし、USPSの仕事は、人口を座標領域にそれほど分割するのではなく、効率的な運送業者のルートを設計することでした。
それは国勢調査局の仕事です。郵便番号は操作に「便利」であるため、地図作成の境界のリストをまとめました。これを行うために、彼らはアドレスの束を国勢調査ブロックに分割しました。次に、USPSの郵便番号データを集計して、国勢調査細分区(大まかな座標データが含まれている)と郵便番号の関係を見つけました。したがって、概算があります 線を多角形としてプロットするとどのように見えるかを示します。 (明らかに、彼らは、線形データに合うようにその内容に基づいて2Dポリゴンを変換することによって1Dラインを2Dポリゴンに変換しました-一意でない通常の郵便番号ごとに。)
彼らのウェブサイト(上記のリンク)から:
郵便番号集計領域(ZCTA)は、米国郵政公社の5桁または3桁の郵便番号の配達領域を概算する統計的な地理的エンティティです。 ZCTAは、米国国勢調査局のマスターアドレスファイル(MAF)の住所に関連付けられた同じ主要な郵便番号を持つ国勢調査ブロックの集合体です.3桁のZCTAコードは、米国国勢調査局に5桁のZIPがない大きな隣接領域に適用されますMAFのコード情報。 ZCTAは、郵便番号の配信領域を正確に示しているわけではなく、メール配信に使用されるすべての郵便番号が含まれているわけではありません。米国国勢調査局は、1990年以前の国勢調査と併せて実施された郵便番号のデータ集計に類似しているが、それに代わる新しい地理的エンティティとしてZCTAを確立しました。
USCBのデータセットは不完全であり、時には不正確です。グーグルもまだデータに穴があります(12345はやや良い例です)-しかしグーグルは最終的に各住所と郵便番号を手作業で調べることによってそれを修正します。彼らはすでにこれを行っていますが、まだすべての地図データを完璧にしたわけではありません。当然、このデータへのアクセスはAPI用語に制限されており、これらを上げるには非常に費用がかかります。
ふぅ。私は負けています。それが物事を明確にするのに役立つことを願っています。免責事項:私はSmartyStreetsの開発者でした。住所データを使用したジオコーディングの詳細。
ZIPコードに関するさらに詳しい情報。