我遇到了一些较小的名称列表/集合,但我想知道是否有免费的数据源可以提供名称列表(逗号分隔或sql结构)?
我找到了这两个站点:
http://names.mongabay.com/most_common_surnames.htm
http://baby-names.familyeducation.com/browse/letter/a?detoured=1
但是,您似乎只能浏览名称,而不能下载一个全面的文件。
美国人口普查局不提供这些信息吗?
发布于 2015-12-08 04:08:35
我所能找到的最好的数据来源是社会保障管理局提供的数据-与人口普查数据不同的是,他们有大约1900年的每年的名字。
发布于 2014-11-26 23:10:19
人口普查局提供了2000年和1990年人口普查中常见姓氏的列表:http://www.census.gov/topics/population/genealogy/data/2000_surnames.html http://www.census.gov/topics/population/genealogy/data/1990_census/1990_census_namefiles.html
1990年的人口普查档案也列出了常见的男性和女性姓名。
发布于 2017-05-27 15:40:05
选项1)我上传了数百万人的数据到github,我从不同的网站抓取了这些数据,并从谷歌开放数据集中转储。
名字和姓氏目录的https://github.com/aakashkag/People-Name-List Github链接
选项2)
谷歌BigQuery公共数据集:https://cloud.google.com/bigquery/public-data/
你可以从谷歌开放数据集中获取姓名和性别。
1)数据集: bigquery-public-data:github_repos
示例:https://app.hyfy.io/v/abRJ75Xizno/
查询:SELECT* FROM fh-bigquery.popular_names.usa_summary_1880_2015 LIMIT 1000可用的总名称: 1858689
2)Dateset: bigquery-public-data.github_repos.commits
查询:选择author.name作为author_name,author.email作为author_email,committer.name作为committer_name,committer.email作为committer_email,repo_name作为bigquery-public-data.github_repos.commits
3)数据集: bigquery-public-data.usa_names.usa_1910_2013`
查询: SELECT * FROM bigquery-public-data.usa_names.usa_1910_2013
或者您可以从Linkdin https://www.linkedin.com/directory/people-a获取
https://stackoverflow.com/questions/18391799
复制相似问题