ケンオール通信第12号:括弧つきの町域(2) 丁目や番地の処理では、括弧内の処理のうち、丁目や番地などの数字情報を処理する方法について紹介しました。
今回は、小字、かぎ括弧、区切り文字の処理を紹介します。
データは、記載がない限り2021-11-30のデータを用いています。
処理結果を確認してみたい方はこちらのデモから試してみてください。
小字の処理
数字でない文字列で、一部の例外(後述)を除いた文字列は全て小字として解釈します。
0580343 北海道 幌泉郡えりも町 東洋(油駒、南東洋、132~156、158~354、366、367番地)
展開すると以下のようになります。 番地は前回説明した通り削除します。
0580343 北海道 幌泉郡えりも町 東洋 油駒 0580343 北海道 幌泉郡えりも町 東洋 南東洋
小字と数字の混在
小字が単独で出現することは少なく、ほとんどのケースで数字と混在して登場します。
以下の2パターンが存在します。
- 小字 + 数字
- 数字 + 小字
いずれの場合も、単位のない数字は全て番地以下の住所であると解釈して削除しています。
例えば、以下は数字 + 小字の一例です。かぎ括弧の処理については後述します。
3842304 長野県 北佐久郡立科町 茂田井(1~500「211番地を除く」「古町」、2527~2529「土遠」)
展開すると以下のようになります。
3842304 長野県 北佐久郡立科町 茂田井 古町 3842304 長野県 北佐久郡立科町 茂田井 土遠
小字 + 丁目
小字 + 丁目の場合、どちらも残すようにしています。
9390321 富山県 射水市 流通センター(青井谷1、2丁目)
展開すると以下のようになります。
53078 9390321 富山県 射水市 流通センター 青井谷1丁目 53079 9390321 富山県 射水市 流通センター 青井谷2丁目
富山県射水市流通センター青井谷について
この住所について、射水市市役所様と水戸田郵便局様に確認してみました。
流通センター青井谷は一見通称のように見えますが、正式な住所です。
昭和58年10月に青井谷と水戸田という地域で企業団地の分譲が始まりました。
流通センター青井谷だけでなく流通センター水戸田という住所も別に存在します。
おそらくその時期にこの住所ができたものと思われますが、正式な利用開始時期はわかりません。
流通センター青井谷のどこからどこまでが大字で、どこからが小字なのかは特に意識していないそうです。
実用上問題ないため、ケンオールでは流通センターを町名、青井谷1丁目を小字として扱っています。
コメント文字列
括弧内の数字でない文字列には、コメントの意味を持つものが存在します。
以下のような文字列のみが書かれている場合はコメント文字列とみなして削除しています。
- 丁目
- 大字
- 番地
- 無番地
- 無番地を除く
- その他
他にもいくつかありますが省略しています。
(その他)は、削除した後にもう少し複雑な処理を行っています。詳細についてはケンオール通信第9号:(その他)の処理を参照してください。
(丁目)
(丁目)と書かれている郵便番号は、その郵便番号が○○町X丁目の郵便番号であることを明示的に示す必要がある場合に使われます。
例えば、青森県弘前市で町名が中野になっている郵便番号は以下の2レコード存在しますが、これらは全く別の地域です。
0368155 青森県 弘前市 中野(丁目) 0361451 青森県 弘前市 中野(その他)
中野(丁目)は弘前学院大学前駅がある市街地のエリアで、中野1丁目~5丁目まであります。
中野(その他)は弘前市西部にある小さな集落です。
こちらの住所では番地のみが用いられ、丁目は存在しません。
かぎ括弧の処理
郵便番号データ内の括弧は丸括弧()だけではありません。かぎ括弧「」や甲括弧〔〕も存在します。
甲括弧を使っている郵便番号は以下の1件のみです。
9790622 福島県 双葉郡富岡町 毛萱(前川原232~244、311、312、337~862番地〔東京電力福島第二原子力発電所構内〕)
甲括弧内の情報は住所補完に必要ないと判断して削除しています。
かぎ括弧が使われている郵便番号は20件あります。
「」内が数字以外で始まっている場合は、便宜上小字の一部として残しています。
9996652 山形県 鶴岡市 添川(渡戸沢「筍沢温泉」)
展開すると以下のようになります。
9996652 山形県 鶴岡市 添川 渡戸沢筍沢温泉
上記以外のパターンは番地か「その他」しかないため、全て削除します。
区切り文字
住所を併記する場合、ほとんどのケースでは読点「、」を区切り文字としています。
6660006 兵庫県 川西市 萩原台西(1、2丁目、3丁目1番~282番)
中黒「・」区切りを使う場合もあります。
9401172 新潟県 長岡市 釜ケ島(土手畑・藤場)
展開すると以下のようになります。
9401172 新潟県 長岡市 釜ケ島 土手畑 9401172 新潟県 長岡市 釜ケ島 藤場
「及び」を使う場合もあります。
5220239 滋賀県 彦根市 宇尾町(897番地及び中島505~518番地)
展開すると以下のようになります。
5220239 滋賀県 彦根市 宇尾町 中島
区切り文字が混在する場合もあります。
8700924 大分県 大分市 牧(1~3丁目、白滝B・C、高見)
この郵便番号には以下の特徴があります。
- 範囲指定の「丁目」と小字の混在
- 区切り文字「、」「・」の混在
詳細は後述しますが、B・Cは現在使われていない番地情報と思われるため削除します。
展開すると以下のようになります。
8700924 大分県 大分市 牧 1丁目 8700924 大分県 大分市 牧 2丁目 8700924 大分県 大分市 牧 3丁目 8700924 大分県 大分市 牧 白滝 8700924 大分県 大分市 牧 高見
大分県大分市牧(白滝B・C)について
大分県大分市牧1~3丁目は、昭和60年(1985年)3月25日に住居表示が刷新された際に誕生した地名です。 1 この際に字白滝という名前は廃止され、牧3丁目に統合されました。
字高見については記載がありませんが、高見児童公園という公園が牧3丁目にあることから、おそらく牧3丁目に統合されたものと思われます。
昭和43年(1968年)から大分臨海工業地帯萩原地区土地区画整理事業が始まりました。 2 その過程で区画整理が完了したため、昭和60年に住居表示が変更されました。
牧ではなくその隣の高城西町には、白滝南児童公園という公園があり、当時の地名の名残を見ることができます。
B・Cという表記については現在のところ調査中です。
アルファベットの番地を持つ地域として有名なのは大阪府大阪市中央区上町です。
こちらの記事によると「アルファベットを街区符号に使うところは、他に聞いたことがない」とあり、大分市でアルファベットの番地が使われていたという情報は現在のところ見つかっておりません。
心当たりのある方がいましたら情報をお待ちしています。
次回予告
次回は括弧内の処理のうち、京都の通り名について書く予定です。
ケンオールについて
「かゆいところにケンオール」 ケンオールは、郵便番号住所検索APIをはじめとした、システム開発を加速する高品質で安全なAPIサービスです。 サービスを試してみたい方はこちらから: kenall.jp
(Shodoで執筆されました)