首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python比较数据表

Python比较数据表
EN

Stack Overflow用户
提问于 2020-05-28 23:39:30
回答 1查看 155关注 0票数 0

我正在做一个项目,我需要比较数据从python与数据从excel或txt文件。我将尝试解释得更好:我从网站上抓取了一个数据表(7行1列的数据表),我需要将这些值与txt或excel文件进行比较。此txt或excel文件有一个数据表,其中包含web抓取的数据表中存在的3个值(3行1列)。

Web抓取数据表:

代码语言:javascript
复制
FT 202003/69362
FT 202003/62581
FT 202003/41307
FT 202003/32316
FT 202003/4664
FT 201903/215090
FT 201903/197043

txt文件或excel文件中的数据表

代码语言:javascript
复制
FT 202003/62581
FT 202003/41307
FT 202003/32316

到目前为止我的代码如下:

代码语言:javascript
复制
faturas = driver.find_elements_by_xpath("//p[@class='text-description-small']//b[contains(text(),'FT')]")
    totalfaturas = len(faturas)
    fat_list = []
    for fat in faturas:
        fat_list.append(fat.text)
        print(fat.text)

这样做的目的是找出哪些值从web抓取的数据表中不存在于文件数据表中,因为所有来自数据表的值在本网站中都有一个相关的按钮,但我只想从txt或excel文件中不存在的值中点击按钮(这部分我认为我可以做到)。有谁可以帮我?

EN

回答 1

Stack Overflow用户

发布于 2020-05-29 00:03:30

您甚至可以使用in检查另一个文本中的一个文本:

代码语言:javascript
复制
text_from_file = '''FT 202003/62581
FT 202003/41307
FT 202003/32316'''

fat_text = 'FT 202003/62581'

if fat_text in text_from_file:
    print('already in file')
else:
    print('new element')

当您将文件中的文本作为项目列表时也是如此

代码语言:javascript
复制
list_from_file = [
    'FT 202003/62581',
    'FT 202003/41307',
    'FT 202003/32316',
]    

fat_text = 'FT 202003/62581'

if fat_text in list_from_file:
    print('already in file')
else:
    print('new element')

对于pandas.DataFrame,您可以使用`

代码语言:javascript
复制
if any(df['items'] == fat_text):

代码:

代码语言:javascript
复制
import pandas as pd

df = pd.DataFrame({'items': [
    'FT 202003/62581',
    'FT 202003/41307',
    'FT 202003/32316',
]})

fat_text = 'FT 202003/62581'

if any(df['items'] == fat_text):
    print('already in file')
else:
    print('new element')

最后,您可以使用sum()将True转换为1,将False转换为0

代码语言:javascript
复制
if sum(df['items'] == fat_text) > 0:

或者筛选行并检查您得到了多少行

代码语言:javascript
复制
if len(df[ df['items'] == fat_text ]) > 0:
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62068714

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档