请评论下面的NLP面试编码任务,我已经为我正在寻找的数据科学NLP职位的候选人准备了。目标是检查候选人对NLP中向量文本表示的基本角色的理解,以及检查候选编码技巧及其利用Numpy提供的矢量化优化计算的能力。
我特别需要你的意见:
任务:
# Write from scratch (you can only use Numpy arrays)
# very basic and simple algorithm to classify sentences:
test1 = "cats like meat and fish is best for cats"
test2 = "train your mind reading good fiction, thrillers and other books"
# Use these sentences to train your classifier:
# Class 1
sent1 = "meat is a good food for all dogs and cats , dogs also like apples"
# Class 2
sent2 = "reading fiction books is a good food for mind and some thrillers are not"为了解决这一问题,候选人应从头开始编写计数向量器和余弦相似函数。利用这些函数可以发现测试句与第1类和第2类的相似性,从而对测试句进行分类。标准化向量对于候选人来说是一个额外的好处。
我花了20分钟来编写代码,测试和描述这个任务。不确定NLP职位候选人可能需要多长时间。
发布于 2022-01-27 12:03:48
发布于 2022-01-31 17:37:34
任务对我来说不清楚。大多数情况下,我不知道这个项目是否意味着完全独立。
https://datascience.stackexchange.com/questions/107511
复制相似问题