ニュース
» 2013年4月24日 更新

データとデザイン研究室 オープンデータのインフォグラフィック ~年代による名前の変遷~

今回はゴールデンウィークを前にして「ゆるネタ」をお送りします。

社会人になってから色々な方と名刺交換をさせていただいているのですが、
ご挨拶した男性陣の名前が「たけし」「たかし」「だいすけ」等々、特定の名前が結構多いということに、ある日ふと気がつきました。
世の中にはどんな名前の人が多いのだろう、と思いたって検索したところ、こちらの明治安田生命さんのWebサイトを見つけました。

明治安田生命 生まれ年別の名前調査

このランキングは、明治安田生命の保険商品の加入者を対象に子どもの名前について毎年調査を行い、ランキング化したものです。
「生まれ年別ベスト10」というページに、1912年(明治45年・大正1年)から2012年(平成24年)までのランキングが掲載されています。まずはこの調査の歴史の長さに驚きます。
そして、ちょうど仕事でご一緒する方々の年代(1960年代~)を見たところ、私の感覚はあたっていました。さきほどの3つの名前、1960年代~1980年代にかけてベスト10の常連であることがわかりました。

生まれ年別ベスト10

他の年代のベスト10も見てみると、使われる漢字の特徴が変化してきていることもわかります。
そこで、ベスト10にランクインしている名前が、10年単位で何回上位10位以内にランクインしているのか回数を集計してスコア化し、それを可視化してみることにしました。
(今回、明治安田生命の広報課の方にデータ加工の許可をいただきました。ご快諾に感謝いたします。)


(1)今回の使用ツール
今回使ったフリーのインフォグラフィック作成ツールは、infogr.am です。データを投入するとブラウザ上でインフォグラフィックを生成してくれるツールです。Facebookへのシェアボタンもついているので、拡散しやすくなっています。

infogr.am


(2)スコア計算方法
ランクインしている年の順位に点数をつけスコア化し、年代単位でスコアを集計しました。
例えば、1910年代の「清」さんは、下記のような計算方法になります。
1912年:2位(9点) 1913年:5位(6点) 1914年:2位(9点) 
1915年:1位(10点) 1916年:2位(9点) 1917年:2位(9点)
1918年:1位(10点) 1919年:2位(9点)
⇒9+6+9+10+9+9+10+9=71点

※各順位の点数は便宜上下記のように設定しました。
1位:10点、2位:9点、3位:8点、4位:7点、5位:6点、
6位:5点、7位:4点、8位:3点、9位:2点、10位:1点

このスコアと名前のリストをinfogr.am上にインポートして、ワードクラウドを用いて可視化すると、こちらの図のようになります。
文字が大きくなるほどランクインの回数が多く、小さいほど少ない名前となります。

例:1910年代の名前ワードクラウド

1910s.jpg


では、早速ワードクラウドをご覧いただきます。年代別に切り替え可能なので、
ぜひ切り替えて見てみてください。


(3)各年代別の名前ランキング ワードクラウドの特徴






■1910年代~1940年代の特徴

  • 1910年代の特徴
・「正」「清」「茂」という字や漢数字入りの名前が目立つ
 ※「正」の字は「大正」から来ている可能性
・男性の名前ということもあり「男」「雄」などの字も使われている

  • 1920年代の特徴
・「清」「茂」、漢数字入りの名前に加え、「博」「弘」「勇」「実」が多くランクイン
・年号である昭和の「昭」と「和」の字を使った名前も登場

  • 1930年代の特徴
・引き続き「博」「弘」「勇」「実」「清」「茂」が何度も登場
・「勲」「進」「勝」などが登場

  • 1940年代の特徴
・「勝利」「武」「功」「稔」などがランクイン

1920年代からの変遷を見ると、「清く、正しい」印象の漢字や生まれた順で漢数字を入れた名前から、世相を反映したような強さやたくましさをイメージさせる漢字の頻出に変化した印象です。また、上位10位の名前群はあまり変わらず順位の変動のみの場合が多くなっています。同じ名前の人が多い時代かもしれません。


■1950年代~1980年代の特徴

  • 1950年代の特徴
・「隆」「茂」「豊」「進」「稔」のように何かを成し遂げたり前進したりするイメージの漢字が多く登場
・「修」「博」「誠」「清」のように 調和や正しさを表す漢字も登場(人名漢字辞典による)

  • 1960年代の特徴
・「誠」「修」に加え、「剛」「徹」が登場
・「浩」や「樹」の字を使った名前も増加(おおらかな自然を想起させる漢字)

  • 1970年代の特徴
・「誠」「剛」「○樹」に加え、「だいすけ(大輔・大介)」「健」の字を使う名前 が登場
・ランクイン常連の名前と、1回ランクインする名前とで2極化する傾向

  • 1980年代の特徴
・最近良く使われる「翔」の字や「○太」「○也」の名前が登場
・1970年代までと比べて、2文字以上の名前が多くランクイン

人名漢字辞典も参照したのですが、1950年代は前進志向と調和を表す漢字が多く、1960年代~1970年代は強そうで突き進むイメージを持たせる「剛」「徹」と、「浩」「樹」「健」のように大らかな自然や健やかさを想起させる漢字が上昇している印象です。1980年代からは使われる漢字に変化が見られ、2文字以上の名前が上位を占めるようになります。

■1990年代以降の特徴

・1980年代から引き続き「翔」「樹」「○太」「大」の字を使う名前が多い
・2000年代から「○斗」という名前もランクイン
・10年間の間に上位10位にランクインする名前の種類が増えている
・上記に伴い、使う漢字が多様になっている

1970年代までの上位10位を占める名前の種類は20前後、1980年代は27種類となっていますが、1990年代以降は30を超えています。同じ読みでも漢字が違う名前が同時にランクインするなど使う漢字の種類が多様になりました。
特に「陸」「大地」「海」「陽」「空」「輝」「颯」「翼」「翔」など自然を想起させるものが目立っています。
つまり圧倒的に多い名前が減り、個性重視の多様な名前が増えたとも言えます。
ワードクラウド上でも、1970年代までは圧倒的に多い名前は大きさが巨大で、それ以外は小さい文字になっていますが、1990年代以降は文字が大きめの名前と、やや小さめの名前群が並んでおり、文字の大きさの違いでも現れています。


以上が私が面白いと感じた特徴なのですが、みなさんはどう思われたでしょうか?



(4)日本の出生率の推移と名前ランキングの特徴
参考程度に、日本の出生率の推移と名前ランキングの特徴を時系列でまとめてみました。
1910年代からの全体の流れを見ると、「清く正しく」「質実剛健」のイメージが強い漢字から、「調和・健康」を経て、ナチュラル志向の漢字を使う名前に変遷していると捉えられるのではないでしょうか。

jikeiretsu.jpg

(5)オープンデータとは?

最後に、少し真面目な話です。タイトルの解説を少しさせていただきます。
今回のコラムは、行政機関や民間企業が保有するデータを複合的に利活用する「オープンデータ」の考え方にヒントを得てトライをしてみたものです。
政府や官公庁、企業が様々な統計・調査を発表していますが、それらのデータが各所で埋もれており、興味を持って探さなければ有効に活用されない現状があります。
そこで下記のような取り組みにより、利活用を促進しようという流れが「オープンデータ」の動きです。

  • ずデータを公開する(二次利用、加工・再販の促進)【オープン性】
  • 利活用しやすいデータ形式の統一【フォーマット統一】
  • いつでもどこでも見つけられる【アクセシビリティ】

オープンデータの利活用の方向性としては「社会課題の解決」や「ビジネス活用」が挙げられています。しかし、どのようなデータが、どこにあるのか分かりづらい現状もあり、具体策が見えづらくなっています。
そこで、自分なりに面白いと思う公開データを組み合わせてインフォグラフィックにしてみることで何かヒントになればと思い、作成してみた次第です。


ふと疑問に思ったことや、気になったことに関するデータは、どこかにあるはずです。データの並びを変えてみたり、他のデータとあわせて見たりしてみると、それまで気がつかなかった面白い特徴を発見できることもあります。
そんな「身近なデータ分析」が広まることを期待しています。


次回以降は、オープンデータ関連の動きなどをまとめながら、引き続きビジュアライズのトライをしてみたいと思います。

Copyright© 2017 ITmedia, Inc. All Rights Reserved.

Loading

プロフィール

後藤真理絵

後藤真理絵

大学時代はエスノグラフィからのモノ作り研究。卒業後は某広告代理店系の制作会社を経て、通信キャリアでマーケティングリサーチ業務および、データを活用した新規事業企画に携わる。現在は、ヤフー株式会社にてアドテク周辺のデータコンサルとして、DSPやDMPのデータ活用支援に従事。

「マーケター通信」購読一覧