首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于预训练模型的大熊猫数据模型在->中的应用

基于预训练模型的大熊猫数据模型在->中的应用
EN

Stack Overflow用户
提问于 2022-03-02 01:06:02
回答 1查看 72关注 0票数 0

我正在尝试将情感分析应用到一条带有推特的熊猫数据中。我会发现错误的

IndexError: index out of range in self.

样本数据集:https://drive.google.com/file/d/14GuN3krdNhGDQCLShn3I6FJG-b5Zt02Z/view?usp=sharing

我如何尝试:

代码语言:javascript
复制
import pandas as pd
from tqdm import tqdm
from transformers import pipeline
tqdm.pandas()

sample = pd.read_csv('sample.csv')
model_name = 'finiteautomata/bertweet-base-sentiment-analysis'

classifier = pipeline('sentiment-analysis', model=model_name)

def sentiment_analysis(row):
    r = classifier(row.text)[0]
    return [r['label'], r['score']]
    
df_sample.progress_apply(sentiment_analysis, axis=1)

一些推文返回错误:IndexError: index out of range in self。我不太确定为什么。

这一次发生在推特78上。

EN

回答 1

Stack Overflow用户

发布于 2022-03-02 11:27:23

你需要用truncating = True把句子截短

代码语言:javascript
复制
def sentiment_analysis(row):
    r = classifier(row.text,truncation=True)[0]
    return [r['label'], r['score']]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71316348

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档