首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何将一个已定义的函数应用于多行?

如何将一个已定义的函数应用于多行?
EN

Stack Overflow用户
提问于 2021-06-04 17:28:45
回答 2查看 25关注 0票数 0

我想将定义的函数"tokenization“应用于数据集"reviews_english”的列"Review Gast“的所有行。我该怎么做呢?目前,我只能将它应用于一行。谢谢!:)

代码语言:javascript
复制
def tokenization(text):
    # Normalize
    text = normalize(text)

    # Remove Punctuation
    text = remove_punctuation(text)

    # Tokenize
    tokens = text.split()

    # Remove Stopwords
    tokens = remove_stopwords(tokens)

    # Apply Bag-of-Words (set of tokens)
    bow = set(tokens)

    return bow

clean_reviews_english =tokenization(reviews_english["Review Gast"][0])
print(clean_reviews_english)
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-06-04 17:31:51

使用列表理解

代码语言:javascript
复制
clean_reviews_english = tokenization(review for review in reviews_english["Review Gast"])

map

代码语言:javascript
复制
clean_reviews_english = map(tokenization, reviews_english["Review Gast"])
票数 0
EN

Stack Overflow用户

发布于 2021-06-04 17:34:22

假设您使用的是pandas数据帧,如果想要将函数应用于列,请使用df["col"].apply(func)

在此示例中,要将结果添加为新列,请使用:

代码语言:javascript
复制
reviews_english["tokenized"] = reviews_english["Review Gast"].astype(str).apply(tokenization)

如果你没有使用熊猫数据帧,那就使用科拉伦的答案。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67834847

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档