web-dev-qa-db-ja.com

データベースまたは英語の姓名のリスト

いくつかの小さなリスト/名前のセットに出くわしましたが、名前のリストを提供できる無料のデータソースがそこにあるかどうか疑問に思っていました(カンマ区切りまたはSQL構造)。

次の2つのサイトを見つけました。

http://names.mongabay.com/most_common_surnames.htm

http://baby-names.familyeducation.com/browse/letter/a?detoured=1

ただし、包括的なファイルをダウンロードするのではなく、名前を参照することしかできないようです。

米国国勢調査局はこの情報を提供していませんか?

20
A.O.

私は、さまざまな国や文化、その中の英国の姓を含むデータベースを作成しています。 プロジェクトとそのデータセットはここにあります: https://github.com/enorvelle/NameDatabases(デッド:リンク、プロジェクト、GitHubアカウント)

これは github.com/smashew/NameDatabases .に移行したようです(唯一の寄稿者「Erik Norvelle」。)

27
Erik Norvelle

私がこれで見つけることができた最高の情報源は、社会保障局によって提供されたデータです-国勢調査のデータとは異なり、彼らは毎年1900年まで遡る最初の名前を持っています。

https://www.ssa.gov/oact/babynames/limits.html

7
Logister

国勢調査局は2000年と1990年の国勢調査からの一般的な姓のリストを提供します: http://www.census.gov/topics/population/genealogy/data/2000_surnames.htmlhttp:/ /www.census.gov/topics/population/genealogy/data/1990_census/1990_census_namefiles.html

1990年の国勢調査ファイルには、一般的な男性と女性の名前のリストも含まれています。

5

オプション1)何百万もの人々のデータをgithubにアップロードし、別のWebサイトからクロールし、Googleオープンデータセットからダンプしました。

https://github.com/aakashkag/People-Name-List [姓名ディレクトリのGithubリンク]

オプション2)

Google BigQuery公開データセット: https://cloud.google.com/bigquery/public-data/

Googleオープンデータセットから名前と性別を取得できます。

1)データセット:bigquery-public-data:github_repos

例: https://app.hyfy.io/v/abRJ75Xizno/

クエリ:SELECT * FROM fh-bigquery.popular_names.usa_summary_1880_2015 LIMIT 1000利用可能な名前の合計:1858689

2)日付セット:bigquery-public-data.github_repos.commits

クエリ:SELECT author.name as author_name、author.email as author_email、committer.name as committer_name、committer.email as committer_email、repo_name FROM bigquery-public-data.github_repos.commits

3)日付セット:bigquery-public-data.usa_names.usa_1910_2013`

クエリ:SELECT * FROM bigquery-public-data.usa_names.usa_1910_2013

または、Linkdinから取得できます https://www.linkedin.com/directory/people-a

1
Aakash Kag