文章/答案/技术大牛

发布

社区首页 >问答首页 >基于预训练模型的大熊猫数据模型在->中的应用

问基于预训练模型的大熊猫数据模型在->中的应用
EN

Stack Overflow用户

提问于 2022-03-02 01:06:02

回答 1查看 72关注 0票数 0

我正在尝试将情感分析应用到一条带有推特的熊猫数据中。我会发现错误的

IndexError: index out of range in self.

样本数据集：https://drive.google.com/file/d/14GuN3krdNhGDQCLShn3I6FJG-b5Zt02Z/view?usp=sharing

我如何尝试：

import pandas as pd
from tqdm import tqdm
from transformers import pipeline
tqdm.pandas()

sample = pd.read_csv('sample.csv')
model_name = 'finiteautomata/bertweet-base-sentiment-analysis'

classifier = pipeline('sentiment-analysis', model=model_name)

def sentiment_analysis(row):
    r = classifier(row.text)[0]
    return [r['label'], r['score']]
    
df_sample.progress_apply(sentiment_analysis, axis=1)

一些推文返回错误：IndexError: index out of range in self。我不太确定为什么。

这一次发生在推特78上。

pytorch

huggingface-transformers

python

pandas

回答 1

Stack Overflow用户

发布于 2022-03-02 11:27:23

你需要用truncating = True把句子截短

def sentiment_analysis(row):
    r = classifier(row.text,truncation=True)[0]
    return [r['label'], r['score']]

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71316348

复制

相似问题

问基于预训练模型的大熊猫数据模型在->中的应用
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于预训练模型的大熊猫数据模型在->中的应用EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于预训练模型的大熊猫数据模型在->中的应用
EN