首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >标记大量配对训练数据

标记大量配对训练数据
EN

Stack Overflow用户
提问于 2020-10-16 23:03:56
回答 2查看 40关注 0票数 0

我在训练一个模型来确定两个人是否是一样的。模型应该包含两个人(表示为dataframe行)

我试着给表单的配对数据贴上标签

代码语言:javascript
复制
Id  | age    | gender| occupation  | region | height | weight(kg)
100 | 16     | 0     | "plumber"   | na     | 169    | 20
300 | 50     | 1     | na          | africa | 12     | 90
代码语言:javascript
复制
Id  | age    | gender| occupation  | region | height | weight(kg)
100 | 16     | 0     | "plumber"   | na     | 169    | 20
700 | 100    | 0     | na          | africa | 12     | 90

这些对都被发送到单独的csv文件中进行标记,因为我想训练一个分类器,它接收成对的人行,并将它们标记为重复的或不重复的。

正如你所看到的,如果我只有10个人,这可能很快就会失控。10C2= 45对。有什么想法,如何使标签的数据更容易?

我考虑过在excel中这样做,但我觉得打开这些excel文件肯定会产生问题。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-10-17 15:46:47

所以我想明白了,我只需要对excel中的行,即row1特性,row2特性,标签。水平阅读这些功能是非常烦人的,但如果我使用外部监视器或2,这并不可怕。

票数 0
EN

Stack Overflow用户

发布于 2020-10-16 23:13:48

O(N*log(N))

  • Check对数据帧进行排序,以查看相邻行是否相等于O(N)

若要对相邻行执行操作,只需将列设置为一个位置;将每一行与原始行进行比较。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64397467

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档