首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python:在Dataset中提取数据集

Python:在Dataset中提取数据集
EN

Stack Overflow用户
提问于 2022-03-08 07:40:41
回答 1查看 57关注 0票数 1

我有一个看起来很奇怪的数据集,每一行都描述另一个数据集。在本例中,"data“是我已转换为dataframe的列表。

代码语言:javascript
复制
result_df = pd.DataFrame(data)

当查看上面dataframe的第一个条目时,我看到了一个5行的dataframe。这是每隔一行的情况。请参见第一行(零行)的dataframe:

代码语言:javascript
复制
result_df[0][0]
    _embedded.results|className _embedded.results|classId   _embedded.results|uri   _embedded.results|searchHit _embedded.results|title _embedded.results|preferredLabel    _embedded.results|isTopConceptInScheme  _embedded.results|isInScheme    _embedded.results|hasSkillType  _embedded.results|hasReuseLevel _embedded.results|broaderHierarchyConcept   _embedded.results|_links    _embedded.results|broaderSkill  BC_name
   0    Skill   http://data.europa.eu/esco/model#Skill  http://data.europa.eu/esco/skill/237db40b-4600...   range of project control principles project management principles   {'de': 'Prinzipien des Projektmanagements', 'n...   [http://data.europa.eu/esco/concept-scheme/mem...   [http://data.europa.eu/esco/concept-scheme/ski...   [http://data.europa.eu/esco/skill-type/knowledge]   [http://data.europa.eu/esco/skill-reuse-level/...   [http://data.europa.eu/esco/isced-f/0413]   {'self': {'href': 'https://ec.europa.eu/esco/a...   NaN Project Financials Control
   1    Skill   http://data.europa.eu/esco/model#Skill  http://data.europa.eu/esco/skill/abb9c7f1-6d69...   Operate projection equipment manually or with ...   operate projector   {'de': 'Projektoren bedienen', 'no': 'betjene ...   [http://data.europa.eu/esco/concept-scheme/mem...   [http://data.europa.eu/esco/concept-scheme/ski...   [http://data.europa.eu/esco/skill-type/skill]   [http://data.europa.eu/esco/skill-reuse-level/...   [http://data.europa.eu/esco/skill/S8.6.2]   {'self': {'href': 'https://ec.europa.eu/esco/a...   NaN Project Financials Control
   2    Skill   http://data.europa.eu/esco/model#Skill  http://data.europa.eu/esco/skill/25a713ba-cbc0...   Manage the overall planning, coordination, and...   manage railway construction projects    {'de': 'Bahnbauprojekte leiten', 'no': 'admini...   NaN [http://data.europa.eu/esco/concept-scheme/ski...   [http://data.europa.eu/esco/skill-type/skill]   [http://data.europa.eu/esco/skill-reuse-level/...   [http://data.europa.eu/esco/skill/S4.2.1]   {'self': {'href': 'https://ec.europa.eu/esco/a...   [http://data.europa.eu/esco/skill/fff5bc45-b50...   Project Financials Control
   3    Skill   http://data.europa.eu/esco/model#Skill  http://data.europa.eu/esco/skill/d37bc902-f640...   prepare financial projections   prepare financial projections   {'de': 'Finanzprognosen erstellen', 'no': 'for...   [http://data.europa.eu/esco/concept-scheme/mem...   [http://data.europa.eu/esco/concept-scheme/ski...   [http://data.europa.eu/esco/skill-type/skill]   [http://data.europa.eu/esco/skill-reuse-level/...   [http://data.europa.eu/esco/skill/S2.7.3]   {'self': {'href': 'https://ec.europa.eu/esco/a...   NaN Project Financials Control
   4    Skill   http://data.europa.eu/esco/model#Skill  http://data.europa.eu/esco/skill/7106b5df-e017...   PRojects IN Controlled Environments, version 2  Prince2 project management  {'de': 'Prince2-Projektmanagement', 'no': 'Pri...   NaN [http://data.europa.eu/esco/concept-scheme/ski...   [http://data.europa.eu/esco/skill-type/knowledge]   [http://data.europa.eu/esco/skill-reuse-level/...   [http://data.europa.eu/esco/isced-f/0413]   {'self': {'href': 'https://ec.europa.eu/esco/a...   [http://data.europa.eu/esco/skill/bec4359e-cb9...   Project Financials Control

下面是一张截图,截图中的数据:

是否有可能在每一行中提取这些数据集并将其附加到一个大数据帧中?因此,最终得到的数据应该大小为“1716x5= 8580”。

我尝试过这样的方法但没有成功:

代码语言:javascript
复制
column_names = ["_embedded.results|className", "_embedded.results|classId", "_embedded.results|uri","_embedded.results|searchHit", "_embedded.results|title ", "_embedded.results|preferredLabel", "_embedded.results|isTopConceptInScheme", "embedded.results|isInScheme","_embedded.results|hasSkillType","_embedded.results|hasReuseLevel","_embedded.results|broaderHierarchyConcept","_embedded.results|_links","_embedded.results|broaderSkill","BC_name"]
my_df = pd.DataFrame(columns = column_names)

for index, i in result_df.iterrows():
  for j in i:
    my_df.append(j)
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-03-08 07:43:34

如果需要,可以将每个值转换为dataFrame:

代码语言:javascript
复制
result_df = pd.concat([pd.DataFrame(x) for x in data], ignore_index=True)

或者如果已经有DataFrames的列表:

代码语言:javascript
复制
result_df = pd.concat(data, ignore_index=True)
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71391503

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档